95%准确率✅！判断DeepSeek正版的方法

作者：95%准确率✅！判断DeepSeek正版的方法

#话2题test #DeepSeek 最近在大规模的调用DeepSeek，也测试了很多中转API，很多中转的服务虽然很稳定但是其可靠性还是有待考究的，今天偶然看到一个prompt测试方法。【一个汉字具有左右结构，左边是木，右边是乞，请问这个字是什么，直接回复这个字，不需要做任何解释。】输入上述prompt给模型以后，真正的R1大概率会给出一个正确的答案，但是由于参数随机性，单次测试不稳定。对于蒸馏版本的llama 70b和qwen 32b大概率不会答对，看think过程也可以看出来搜索答案的过程很混乱。对于14b参数及以下的参数的模型不仅不会回答正确，而且还很大可能在think中陷入死循环。为了细致描述，我在上述很多表述中用了很多“大概率”这个词。稳定的测试方法是，将上述prompt输入到模型中，多次推理观察输出结果和think过程可以综合判断一个中转API模型后面是不是真的DeepSeek-R1满血版。另注：昇腾910b部署的满血版R1也可以正确输出结果。

文章详情

95%准确率✅！判断DeepSeek正版的方法

推荐阅读