文章详情

专注互联网科技,赋能企业数字化发展

⚠️DeepSeek-V4⚠️api请注意

作者:⚠️DeepSeek-V4⚠️api请注意

不然你就会像我一样莫名其妙烧掉很多💰 直接放结论 【不确定对不对啊,个人理解的,d说的在p3】 1️⃣注意上下文长度是否为“无上限” *如果【延续以前压缩过的对话框】 只要设置的上下文能覆盖的, 【全部⚠️全部⚠️全部】都会框进去的 2️⃣如果历史文件有超大内存的文档也注意 (我是偷懒,这阵子都是直接导出历史全部聊天记录,让新档分析对话风格和我聊天…) p4是v3 v4新旧模型价格对比 (d自己写的我没核对) p5“命中/未命中缓存”到底是什么 p6 token消耗大的原因 p7-8如何有效控制成本 ⚠️如果有类似情况, 可酌情参考立刻调整: 1. 🩵切换模型 日常聊天和对话可以使用V4-Flash。 Pro可以留给复杂推理任务。 2. 💚关闭“无上限上下文” 设置一个合理的上下文长度(比如32K tokens) 纯文本我这里近似保留最近100轮左右对话。 旧的历史存档,需要时再单独引用。 3. 💙不要每次对话都加载整份历史文档: 把历史文档作为“背景资料”一次性导入后, 后续对话不要重复发送。 如果必须保留长记忆, 可以用外部记忆工具(如mem0)或定期手动摘要。#大模型 #复盘 #deepseek #希望对大家有帮助

返回新闻列表