Hardware

翻译：Transwan 改写：Carl Cui 图片来源：TechRadar / Getty Images 2026 年 6 月 1 日，台北 Computex 2026 上，NVIDIA 发布了 RTX Spark。单纯看参数，RTX Spark 很容易被当作又一颗高性能 PC 芯片：更强的 CPU，更强的 GPU，更大的内存，更适合 AI 的算力。硬件发布会一直就这样，只要参数堆得够高，就能引起关注。但是对真正构建 AI 应用的人来说，它最重要的地方不是“笔记本终于能跑多大的模型”，而是它把一个被我们默认了三年的架构重新摆在桌面上：AI 推理一定要在云端吗？过去几年，大多数 AI 应用的默认答案都是“是”。你在对话框里输入一句话，请求离开本机，进入 OpenAI、Anthropic、Google 或其他云端数据中心。模型在远端 GPU 集群上完成推理，再把结果返回。开发者围绕这个流程实现 agent：选择模型、组织 prompt、接入工具、压缩 token 成本、处理延迟、评估隐私风险，等等。这套架构下诞生了很多好用的产品。它让小团队也能调用最强模型，让很多产品不必自己拥有昂贵硬件。但它也悄悄建立起一种成规：只要你想使用足够强的 AI，就必须把推理交给远端数据中心。 RTX Spark 的意义，在于它开始松动这个前提。 NVIDIA 对它的定位不是普通 PC 芯片，而是面向本地 AI agents 的 Windows PC 平台。换句话说，它要让一部分过去默认上云的 AI 工作负载，回到用户面前这台机器上。对我来说，这不是硬件新闻，而是一个架构信号。未来的 AI 系统，不应该再默认“所有推理都走云端”。一个更好的问题是：哪些推理必须在云端，哪些推理应该留在本地？ ...

翻译：Transwan 校对：Carl Cui 引言：对于想构建本地 AI 环境的人来说，如何选择硬件一直是个难题。毕竟现在跟 AI 有关的硬件，价格一路水涨船高，即便是玩硬件的富哥，“我都懂”也肯定比“我都有”来得地道。这篇文章从应用场景出发，讨论该如何选择本地 AI 硬件。作者压根没有考虑那些入门级或者中等程度的选项，直接在 M5 MBP、DGX Spark 和 RTX PRO 6000 之间比较，主打一个退烧。不知道你看完会不会有收获，反正我决定老老实实先用 API 套餐吧。以下是翻译正文：在决定购买 M5 MBP、DGX Spark 还是 RTX PRO 6000 之前，让我们先思考这个问题：你的硬件究竟应该加速代理循环（agent loop）的哪个部分？聊天会话和本地 AI 代理系统对硬件的要求不同。AI 编程代理任务侧重于长上下文的重复读取、工具调用、缓存频繁失效（churn）、后台并行工作的子代理、检索、子进程、执行测试、容器这些方面，并且经常会出现多个代理同时使用同一个 LLM 服务的情况。相比在 Mac 和 NVIDIA 或者统一内存和 VRAM 之间权衡，我们更应该关注工作负载拆解问题。在开始讨论硬件之前，我想纠正一种常见的误区：通过比较 token/sec 指标来决定要购买的硬件。我们应该试着将本地代理工作流映射到以下四个瓶颈上：模型匹配度预填充延迟解码吞吐量并发服务表现这样尝试以后，你就不太容易做出"冲动"的购买决定，也更能把好钢用在刀刃上。基准测试引发的争议最近 M5 对比 DGX Spark 对比 Strix Halo 对比 RTX PRO 6000 讨论中最有用的部分是如何设计基准测试。MMBT fleet study 考虑了其他许多硬件对比测试经常会忽略的事情：它尽量保持模型大小和运行时引擎不变。 ...

Hardware

RTX Spark 的真正意义：本地 AI 重新走到台前

硬核对决：M5 Max vs DGX Spark vs RTX Pro 6000