模型容量扩张24倍，用户推理成本反而更小

发布时间：2026-06-10 04:52:26 来源：神码知识网

作者：模型容量扩张24倍，用户推理成本反而更小

我前后花了几天时间，把 DeepSeek 从 2023 年 11 月第一个版本到 2026 年 4 月最新的 V4 双旗舰，所有官方公告、GitHub、HuggingFace 模型卡、arXiv 论文一一翻了一遍，整理成 5 集系列。第 1 集从一组让我个人很惊讶的数字开始——三年里 DeepSeek 模型容量扩张了 24 倍，但用户每次推理实际承担的计算成本，反而比第一代还要略小。这是非常了不起的工程成就。 📺 系列目录 EP01 三年 24 倍参数，激活反而更小（本集） EP02 V1→V2→V3：找到方法论，站上世界前沿 EP03 R1 那一夜：英伟达单日蒸发 5890 亿美元 EP04 默默进入 Agent 时代 + V4 双旗舰 EP05 全球版图 + 中国故事 + 完结篇 #大模型 #DeepSeek #国产大模型 #ai