文章详情

专注互联网科技,赋能企业数字化发展

模型容量扩张24倍,用户推理成本反而更小

作者:模型容量扩张24倍,用户推理成本反而更小

我前后花了几天时间,把 DeepSeek 从 2023 年 11 月第一个版本到 2026 年 4 月最新的 V4 双旗舰,所有官方公告、GitHub、HuggingFace 模型卡、arXiv 论文一一翻了一遍,整理成 5 集系列。 第 1 集从一组让我个人很惊讶的数字开始——三年里 DeepSeek 模型容量扩张了 24 倍,但用户每次推理实际承担的计算成本,反而比第一代还要略小。这是非常了不起的工程成就。 📺 系列目录 EP01 三年 24 倍参数,激活反而更小(本集) EP02 V1→V2→V3:找到方法论,站上世界前沿 EP03 R1 那一夜:英伟达单日蒸发 5890 亿美元 EP04 默默进入 Agent 时代 + V4 双旗舰 EP05 全球版图 + 中国故事 + 完结篇 #大模型 #DeepSeek #国产大模型 #ai

返回新闻列表