<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Hardwares on 楠楠自瑜</title>
    <link>https://cnutshell.net/hardware/</link>
    <description>Recent content in Hardwares on 楠楠自瑜</description>
    <generator>Hugo -- 0.157.0</generator>
    <language>zh-cn</language>
    <lastBuildDate>Thu, 28 May 2026 00:05:37 +0800</lastBuildDate>
    <atom:link href="https://cnutshell.net/hardware/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>硬核对决：M5 Max vs DGX Spark vs RTX Pro 6000</title>
      <link>https://cnutshell.net/hardware/m5-vs-dgx-spark-vs-rtx-pro-6000/</link>
      <pubDate>Thu, 28 May 2026 00:05:37 +0800</pubDate>
      <guid>https://cnutshell.net/hardware/m5-vs-dgx-spark-vs-rtx-pro-6000/</guid>
      <description>&lt;blockquote&gt;
&lt;p&gt;翻译：Transwan&lt;/p&gt;
&lt;p&gt;校对：Carl Cui&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;引言：对于想构建本地 AI 环境的人来说，如何选择硬件一直是个难题。毕竟现在跟 AI 有关的硬件，价格一路水涨船高，即便是玩硬件的富哥，“我都懂”也肯定比“我都有”来得地道。这篇文章从应用场景出发，讨论该如何选择本地 AI 硬件。作者压根没有考虑那些入门级或者中等程度的选项，直接在 M5 MBP、DGX Spark 和 RTX PRO 6000 之间比较，主打一个退烧。不知道你看完会不会有收获，反正我决定老老实实先用 API 套餐吧。以下是翻译正文：&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;在决定购买 M5 MBP、DGX Spark 还是 RTX PRO 6000 之前，让我们先思考这个问题：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;em&gt;&lt;strong&gt;你的硬件究竟应该加速代理循环（agent loop）的哪个部分？&lt;/strong&gt;&lt;/em&gt;&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;聊天会话和本地 AI 代理系统对硬件的要求不同。AI 编程代理任务侧重于&lt;strong&gt;长上下文的重复读取、工具调用、缓存频繁失效（churn）、后台并行工作的子代理、检索、子进程、执行测试、容器&lt;/strong&gt;这些方面，并且经常会出现多个代理同时使用同一个 LLM 服务的情况。&lt;/p&gt;
&lt;p&gt;相比在 Mac 和 NVIDIA 或者统一内存 和 VRAM 之间权衡，我们更应该关注&lt;strong&gt;工作负载拆解问题&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;在开始讨论硬件之前，我想纠正一种常见的误区：通过比较 token/sec 指标来决定要购买的硬件。我们应该试着将本地代理工作流映射到以下四个&lt;strong&gt;瓶颈&lt;/strong&gt;上：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;模型匹配度&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;预填充延迟&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;解码吞吐量&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;并发服务表现&lt;/strong&gt;&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这样尝试以后，你就不太容易做出&amp;quot;冲动&amp;quot;的购买决定，也更能把好钢用在刀刃上。&lt;/p&gt;
&lt;h2 id=&#34;基准测试引发的争议&#34;&gt;基准测试引发的争议&lt;/h2&gt;
&lt;p&gt;最近 &lt;strong&gt;M5 对比 DGX Spark 对比 Strix Halo 对比 RTX PRO 6000&lt;/strong&gt; 讨论中最有用的部分是如何设计基准测试。&lt;a href=&#34;https://github.com/Light-Heart-Labs/MMBT-Messy-Model-Bench-Tests&#34;&gt;MMBT fleet study&lt;/a&gt; 考虑了其他许多硬件对比测试经常会忽略的事情：它尽量保持模型大小和运行时引擎不变。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
