一些对大模型不太成熟的想法。

作者：一些对大模型不太成熟的想法。

这段时间一直在换着不同的大模型给自己在家里的智能体做实验，突然好奇了一个想法，就是国内大模型和美国的“御三家”还有多大差距呢。连夜跑了个研究拉了些资料，分析了一下，效果还行，大家感兴趣可以看看呀。[让我看看][让我看看] ==================================== 这是一份中美大模型对比报告，从性能、价格、科研能力到易用性四个维度拆了一下。几个核心发现分享给大家： 1. 基础性能差距已经很小了，顶尖模型Arena评分差距不到3%，日常使用体感差不多。 2. 但价格差很大——GPT-5.5输出单价是DeepSeek的34倍，Claude更贵。当然这是标价，实际用起来没那么夸张。 3. 真正拉开差距的是科研场景：英文文献引用准确率、学术写作、Notebook生态这些，美国模型确实领先不少。 4. 中国的优势也很明确：开源、便宜、中文场景。DeepSeek永久降价直接把行业卷到了新高度。 ==================================== 数据都来源于斯坦福HAI报告和各厂商官方，5张对比图表放长图里了，大家感兴趣可以看看，当然了欢迎各位指出问题，或提出不同意见，以扩充我的角度，和可以让我有更深刻的研究。#大模型#国内大模型#美国大模型#大模型对比

文章详情

一些对大模型不太成熟的想法。

推荐阅读