文章详情

专注互联网科技,赋能企业数字化发展

deepseekV4后训练!深圳河套学院用国产完成

作者:deepseekV4后训练!深圳河套学院用国产完成

别小看高校 AI 实验室!深圳河套干成了国产算力里程碑! 说出来你可能不信,不是大厂,是一所成立不到 1 年的学院,带着学生把国产算力的天花板捅破了。 深圳河套学院拉上哈工大深圳、深圳大数据研究院、华为三大核心部门,再配上深智城的算力底座,组成了一个 "产学研天团"。他们只用1 个月,就用纯国产昇腾 910C 千卡集群,啃下了1.6 万亿参数 DeepSeek-V4-Pro 全参数后训练这块硬骨头。 这可不是小打小闹的微调: 全程1500 + 步零跳过、零报错、零中断,稳得离谱 算力利用率(MFU)干到34.9%,和英伟达 H200 只差 1.3 个百分点 关键训练算子效率直接提升了14% 更牛的是,这是全世界第一个由第三方机构用国产算力完成的 DeepSeek-V4-Pro 全参数训练工程实践。以前国产算力只能搞搞推理和小修小补,现在终于能扛住世界级大模型的深度训练了。 最有意思的彩蛋:这次攻关还是个 "实战课堂",42 名学生全程参与了从数据制作到训练监控的全流程,直接把毕业论文写在了国产 AI 的战场上。 今早的新闻!来自深圳发布官方号! #deepseek #深圳 #深圳河套学院 #国产 #华为 #昇腾 #大模型 #荒岛书生codedoctor #codedoctor

返回新闻列表