⚠️DeepSeek-V4⚠️api请注意

作者：⚠️DeepSeek-V4⚠️api请注意

不然你就会像我一样莫名其妙烧掉很多💰 直接放结论【不确定对不对啊，个人理解的，d说的在p3】 1️⃣注意上下文长度是否为“无上限” *如果【延续以前压缩过的对话框】只要设置的上下文能覆盖的，【全部⚠️全部⚠️全部】都会框进去的 2️⃣如果历史文件有超大内存的文档也注意（我是偷懒，这阵子都是直接导出历史全部聊天记录，让新档分析对话风格和我聊天…） p4是v3 v4新旧模型价格对比（d自己写的我没核对） p5“命中/未命中缓存”到底是什么 p6 token消耗大的原因 p7-8如何有效控制成本 ⚠️如果有类似情况，可酌情参考立刻调整： 1. 🩵切换模型日常聊天和对话可以使用V4-Flash。 Pro可以留给复杂推理任务。 2. 💚关闭“无上限上下文” 设置一个合理的上下文长度（比如32K tokens）纯文本我这里近似保留最近100轮左右对话。旧的历史存档，需要时再单独引用。 3. 💙不要每次对话都加载整份历史文档：把历史文档作为“背景资料”一次性导入后，后续对话不要重复发送。如果必须保留长记忆，可以用外部记忆工具（如mem0）或定期手动摘要。#大模型 #复盘 #deepseek #希望对大家有帮助

文章详情

⚠️DeepSeek-V4⚠️api请注意

推荐阅读