DeepSeek v4-pro 的账单让我当场清醒

作者：DeepSeek v4-pro 的账单让我当场清醒

打开控制台血压直接上来。 30 分钟，token 消耗 46,788,528，费用 ¥20.19。换算一下： · 26,000 token / 秒 · ¥0.011 / 秒 · 按这速度跑一天 ≈ ¥970 几个关键比例👇 输入:输出 ≈ 213:1 缓存命中率 87%（4061 万 / 4657 万）输出仅 21 万 token 这组数据说明底层有一个很大的 base context 在被反复塞入，单次请求上下文大概 10-20 万 token，半小时被调用 200+ 次。对比同期 deepseek-v4-flash：¥0.02。同样半小时，差了 1000 倍。问题拆解🤔 1️⃣ v4-pro 定价本就是 flash 的几十到上百倍，大上下文 × 高频调用，账单是乘法关系 2️⃣ Agent 类工具每轮 tool call 都会重新 attach 全量上下文，缓存命中再高，没命中那 15% 也够烧 3️⃣ 若触发工具调用死循环，token 曲线会近乎垂直上扬初步判断：不是计费 bug，是使用姿势问题。缓存命中 87% 证明服务端 prompt cache 工作正常，真正吃钱的是未命中的 596 万 token × 高频重复。下一步动作： · 后台按时间维度拉 request log，算单次平均 token · 检查 agent 是否陷入工具调用回环 · 评估 pro / flash 任务分层，简单任务不该上 pro 等我拉完 usage 明细再来实锤，到底是 agent 抽风还是我自己 attach 了巨型 context。 #DeepSeek #v4pro #AI编程 #token消耗 #大模型成本 #LLM #程序员日常 #AI编程 #token消耗

文章详情

DeepSeek v4-pro 的账单让我当场清醒

推荐阅读