最近总有人问我:想在本地跑大模型,到底是买台高配 MacBook,还是攒一台塞满显卡的主机? 先说结论:这俩根本不是一回事,搞错了真的会买亏 💸 先理解最关键的一点👇 🍎 MacBook 的统一内存,本质就是一块「很慢、但显存超大」的显卡。CPU 和 GPU 共用同一块内存,没有 PCIe 来回搬数据的瓶颈,所以它能一口气把 70B 甚至更大的模型整个塞进去——这是普通显卡做不到的。代价是算力远低于 N 卡,吐字慢、首字要等。 🟢 独立 N 卡正相反:算力暴力、吐字飞快。但单卡显存小,3090/4090 才 24GB,旗舰 5090 也就 32GB,模型一大就得量化压缩或者拆到多张卡上。 一句话:「能装下」和「跑得快」,往往只能二选一。 放一组同口径的实测对比(非官方跑分,数字看个大概): · 同一个 Qwen 35B:M5 的 Mac 大约 80 tokens/秒,RTX 5090 大约 280,差不多快 3.5 倍 · 可用显存:64GB 的 Mac 扣掉系统占用,实际能用 50–56GB 左右;N 卡单卡 24–32GB · 性价比:不少人提到,二手攒几张 3090,比一台高配 MacBook 更便宜,还更快 那到底怎么选?对号入座👇 【选 MacBook】要装超大模型、隐私敏感、做研究试验,又想要便携安静——容量优先,还能带着走。 【选 N 卡】(甚至二手多卡 3090)追求速度、要做模型微调、看重性价比,且有固定的主机位置。 【直接上云】没有持续的本地工作负载,只是偶尔重度跑一跑——按需付费,往往最划算。 存图随时查,对比表在第三张📌 你是哪一类?或者已经在本地跑模型了?评论区聊聊你的配置~ #本地部署大模型 #LLM #MacBook #英伟达显卡 #人工智能 #AI #统一内存 #开源模型 #程序员 #装机