文章详情

专注互联网科技,赋能企业数字化发展

DeepSeek v4-pro 的账单让我当场清醒

作者:DeepSeek v4-pro 的账单让我当场清醒

打开控制台血压直接上来。 30 分钟,token 消耗 46,788,528,费用 ¥20.19。 换算一下: · 26,000 token / 秒 · ¥0.011 / 秒 · 按这速度跑一天 ≈ ¥970 几个关键比例👇 输入:输出 ≈ 213:1 缓存命中率 87%(4061 万 / 4657 万) 输出仅 21 万 token 这组数据说明底层有一个很大的 base context 在被反复塞入,单次请求上下文大概 10-20 万 token,半小时被调用 200+ 次。 对比同期 deepseek-v4-flash:¥0.02。同样半小时,差了 1000 倍。 问题拆解🤔 1️⃣ v4-pro 定价本就是 flash 的几十到上百倍,大上下文 × 高频调用,账单是乘法关系 2️⃣ Agent 类工具每轮 tool call 都会重新 attach 全量上下文,缓存命中再高,没命中那 15% 也够烧 3️⃣ 若触发工具调用死循环,token 曲线会近乎垂直上扬 初步判断:不是计费 bug,是使用姿势问题。 缓存命中 87% 证明服务端 prompt cache 工作正常,真正吃钱的是未命中的 596 万 token × 高频重复。 下一步动作: · 后台按时间维度拉 request log,算单次平均 token · 检查 agent 是否陷入工具调用回环 · 评估 pro / flash 任务分层,简单任务不该上 pro 等我拉完 usage 明细再来实锤,到底是 agent 抽风还是我自己 attach 了巨型 context。 #DeepSeek #v4pro #AI编程 #token消耗 #大模型成本 #LLM #程序员日常 #AI编程 #token消耗

返回新闻列表