6月5日官方确认,华为联合科研团队,用1000颗昇腾910C集群,成功完成1.6万亿参数DeepSeek-V4-Pro的全参数后训练,稳定运行超1500步,算子效率提升14%。 要知道去年还完全做不到!之前昇腾短板很明显,互联带宽、软件栈都不成熟,DeepSeek训练只能靠英伟达,昇腾仅能做简单推理。 这次是实打实全参数更新训练,不是敷衍的浅层适配,而且该模型立项就适配昇腾,意义完全不一样。 不过客观说,目前仍有短板!暂无公开实测数据、芯片利用率等对比指标,且本次只是后训练调优,难度远低于从零预训练。昇腾整体性能,和H100依旧有差距。 但不可否认,这是国产算力从“只能推理”迈向“可做训练”的关键一步,算力自主又迈了一大步✨ #华为昇腾 #国产算力 #AI大模型 #DeepSeek #科技热点 #半导体突破