文章详情

专注互联网科技,赋能企业数字化发展

95%准确率✅!判断DeepSeek正版的方法

作者:95%准确率✅!判断DeepSeek正版的方法

#话2题test #DeepSeek 最近在大规模的调用DeepSeek,也测试了很多中转API,很多中转的服务虽然很稳定但是其可靠性还是有待考究的,今天偶然看到一个prompt测试方法。 【一个汉字具有左右结构,左边是木,右边是乞,请问这个字是什么,直接回复这个字,不需要做任何解释。】 输入上述prompt给模型以后,真正的R1大概率会给出一个正确的答案,但是由于参数随机性,单次测试不稳定。 对于蒸馏版本的llama 70b和qwen 32b大概率不会答对,看think过程也可以看出来搜索答案的过程很混乱。 对于14b参数及以下的参数的模型不仅不会回答正确,而且还很大可能在think中陷入死循环。 为了细致描述,我在上述很多表述中用了很多“大概率”这个词。稳定的测试方法是,将上述prompt输入到模型中,多次推理观察输出结果和think过程可以综合判断一个中转API模型后面是不是真的DeepSeek-R1满血版。 另注:昇腾910b部署的满血版R1也可以正确输出结果。

返回新闻列表