Nvidia

翻译：Transwan 改写：Carl Cui 图片来源：TechRadar / Getty Images 2026 年 6 月 1 日，台北 Computex 2026 上，NVIDIA 发布了 RTX Spark。单纯看参数，RTX Spark 很容易被当作又一颗高性能 PC 芯片：更强的 CPU，更强的 GPU，更大的内存，更适合 AI 的算力。硬件发布会一直就这样，只要参数堆得够高，就能引起关注。但是对真正构建 AI 应用的人来说，它最重要的地方不是“笔记本终于能跑多大的模型”，而是它把一个被我们默认了三年的架构重新摆在桌面上：AI 推理一定要在云端吗？过去几年，大多数 AI 应用的默认答案都是“是”。你在对话框里输入一句话，请求离开本机，进入 OpenAI、Anthropic、Google 或其他云端数据中心。模型在远端 GPU 集群上完成推理，再把结果返回。开发者围绕这个流程实现 agent：选择模型、组织 prompt、接入工具、压缩 token 成本、处理延迟、评估隐私风险，等等。这套架构下诞生了很多好用的产品。它让小团队也能调用最强模型，让很多产品不必自己拥有昂贵硬件。但它也悄悄建立起一种成规：只要你想使用足够强的 AI，就必须把推理交给远端数据中心。 RTX Spark 的意义，在于它开始松动这个前提。 NVIDIA 对它的定位不是普通 PC 芯片，而是面向本地 AI agents 的 Windows PC 平台。换句话说，它要让一部分过去默认上云的 AI 工作负载，回到用户面前这台机器上。对我来说，这不是硬件新闻，而是一个架构信号。未来的 AI 系统，不应该再默认“所有推理都走云端”。一个更好的问题是：哪些推理必须在云端，哪些推理应该留在本地？ ...