本地跑大模型，买 MacBook 还是攒 N 卡？

作者：本地跑大模型，买 MacBook 还是攒 N 卡？

最近总有人问我：想在本地跑大模型，到底是买台高配 MacBook，还是攒一台塞满显卡的主机？先说结论：这俩根本不是一回事，搞错了真的会买亏 💸 先理解最关键的一点👇 🍎 MacBook 的统一内存，本质就是一块「很慢、但显存超大」的显卡。CPU 和 GPU 共用同一块内存，没有 PCIe 来回搬数据的瓶颈，所以它能一口气把 70B 甚至更大的模型整个塞进去——这是普通显卡做不到的。代价是算力远低于 N 卡，吐字慢、首字要等。 🟢 独立 N 卡正相反：算力暴力、吐字飞快。但单卡显存小，3090/4090 才 24GB，旗舰 5090 也就 32GB，模型一大就得量化压缩或者拆到多张卡上。一句话：「能装下」和「跑得快」，往往只能二选一。放一组同口径的实测对比（非官方跑分，数字看个大概）： · 同一个 Qwen 35B：M5 的 Mac 大约 80 tokens/秒，RTX 5090 大约 280，差不多快 3.5 倍 · 可用显存：64GB 的 Mac 扣掉系统占用，实际能用 50–56GB 左右；N 卡单卡 24–32GB · 性价比：不少人提到，二手攒几张 3090，比一台高配 MacBook 更便宜，还更快那到底怎么选？对号入座👇 【选 MacBook】要装超大模型、隐私敏感、做研究试验，又想要便携安静——容量优先，还能带着走。【选 N 卡】（甚至二手多卡 3090）追求速度、要做模型微调、看重性价比，且有固定的主机位置。【直接上云】没有持续的本地工作负载，只是偶尔重度跑一跑——按需付费，往往最划算。存图随时查，对比表在第三张📌 你是哪一类？或者已经在本地跑模型了？评论区聊聊你的配置～ #本地部署大模型 #LLM #MacBook #英伟达显卡 #人工智能 #AI #统一内存 #开源模型 #程序员 #装机

文章详情

本地跑大模型，买 MacBook 还是攒 N 卡？

推荐阅读