文章详情

专注互联网科技,赋能企业数字化发展

Note 01:输入think后,似乎输出了训练数据?

作者:Note 01:输入think后,似乎输出了训练数据?

最近看到一个X上的帖子:有人给DeepSeek V4输入一串特殊 token,比如 <|begin▁of▁sentence|><|sft▁begin|>,模型会开始生成一段很像训练样本的对话。 里面可能会有用户问题、思考过程、最终回答,看起来像模型把训练数据吐出来了。但这个现象不能直接等同于训练数据泄露。做过SFT的同学应该比较熟悉这类模板。很多后训练数据会被整理成类似结构: [ 用户问题--->模型进入 --->生成推理过程--->结束思考--->给出正式回答 ] 不同模型的模板细节不完全一样,但核心逻辑类似:用边界 token 或模板字段告诉模型,当前处在用户问题、思考过程,还是最终回答区域。久而久之, 就不再只是几个字符。它会变成一个很强的条件信号,告诉模型:接下来应该进入“思考链样本”的生成分布。所以当用户手动输入这些边界 token,相当于把上下文伪装成一条后训练样本的开头。模型接下来最自然的续写,就可能是: [ 一个用户问题--->一段 thinking trace--->一个 answer ] 也就是说,模型仍然是在做下一个 token 预测,只是当前上下文把它推到了后训练样本的续写分布里。这类现象也有论文系统研究过。[1] 这篇文章讨论了一个问题:开源模型里,用户可以控制 tokenizer 和 chat template,于是研究者可以用后训练模板前缀,诱导模型生成类似对齐数据的样本,并用 embedding 检索去检查这些生成内容和真实后训练数据的相似度。 所以我的观点是: 不是魔法开关,而是后训练阶段学到的边界信号。它会把模型带入一个特定的生成分布。我们看到的“像训练样本”,很多时候是这个分布被手动触发后的结果。 另外还有一个很有意思的问题,昨天我的一个同事问我,为什么模型思考的时候,总会说一些Hmm/Wait/But/However之类的词。恰好最近也有一篇论文在讨论这个点,我们下篇帖子聊. #Halucinaut #AI #论文 #LLM #AI技术 #transformer #自回归模型 #大模型 #人工智能发展 #算法

返回新闻列表