<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Model on 楠楠自瑜</title>
    <link>https://cnutshell.net/tags/model/</link>
    <description>Recent content in Model on 楠楠自瑜</description>
    <generator>Hugo -- 0.157.0</generator>
    <language>zh-cn</language>
    <lastBuildDate>Mon, 15 Jun 2026 00:11:48 +0800</lastBuildDate>
    <atom:link href="https://cnutshell.net/tags/model/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>AI Agent 时代，模型选择比模型崇拜更重要</title>
      <link>https://cnutshell.net/insights/about-model-triage/</link>
      <pubDate>Mon, 15 Jun 2026 00:11:48 +0800</pubDate>
      <guid>https://cnutshell.net/insights/about-model-triage/</guid>
      <description>&lt;p&gt;&lt;img alt=&#34;Gemini Generated Image 138szz138szz138s&#34; loading=&#34;lazy&#34; src=&#34;https://cdn.jsdelivr.net/gh/cuiguoke/blogger-assets/images/20260615001200622.png&#34;&gt;&lt;/p&gt;
&lt;p&gt;Claude Fable 5 发布了，Claude Fable 5 下线了，这是在 2026 年 6 月初发生在前后脚的事情。&lt;/p&gt;
&lt;p&gt;Anthropic 在 2026 年 6 月 9 日发布了 Claude Fable 5。它被称为一个带有安全限制的 Mythos 模型，面向 Pro、Max、Team 和 Enterprise 用户开放，本来这个开放窗口就很短：从 6 月 23 日开始，Fable 5 不再包含在默认订阅计划中，而是要消耗额外额度。&lt;/p&gt;
&lt;p&gt;然后没几天，美国政府以国家安全为由，对 Anthropic 的 Fable 5 和 Mythos 5 实施出口管制，限制外国政府、外国公司和非美国人员访问这些模型。由于 Anthropic 难以在现有系统中可靠地区分用户国籍和访问资格，最终选择暂停所有客户对这两个模型的访问。&lt;/p&gt;
&lt;p&gt;这个新闻当然炸裂。它牵涉模型能力、安全边界、出口管制、地缘政治等等因素。&lt;/p&gt;
&lt;p&gt;但我想谈的是另一个问题：即使 Fable 5 没有下线，我们真的应该默认使用最强模型吗？&lt;/p&gt;
&lt;h2 id=&#34;fable-到底是贵还是便宜&#34;&gt;Fable 到底是贵，还是便宜？&lt;/h2&gt;
&lt;p&gt;Fable 5 发布后，围绕它的一个很有意思的讨论是“它到底值不值”。乍一看，像是在讨论价格，其实是跟工程决断有关。&lt;/p&gt;
&lt;p&gt;国外 &lt;code&gt;Mitchell Hashimoto&lt;/code&gt; 在社交媒体分享过一个的测试，他让 Fable、GPT-5.5 和 GLM-5.1 处理普通的“实现这个功能”类的编码任务，最终三个模型都给出了可接受的结果。不过成本差距非常明显：GLM-5.1 不到 1 美元，GPT-5.5 大约 1.50 美元，而 Fable 跑了 40 分钟，花了 9 美元。&lt;/p&gt;</description>
    </item>
    <item>
      <title>AI 101: 什么是模型权重</title>
      <link>https://cnutshell.net/tutorial/what-is-model-weights/</link>
      <pubDate>Sat, 13 Jun 2026 15:02:03 +0800</pubDate>
      <guid>https://cnutshell.net/tutorial/what-is-model-weights/</guid>
      <description>&lt;p&gt;&lt;img alt=&#34;model weights cover&#34; loading=&#34;lazy&#34; src=&#34;https://cdn.jsdelivr.net/gh/cuiguoke/blogger-assets/images/20260613150212453.png&#34;&gt;&lt;/p&gt;
&lt;p&gt;我们在讨论大模型时，经常会听到这样一些说法：&lt;/p&gt;
&lt;p&gt;“这个模型有 7B 参数。”&lt;/p&gt;
&lt;p&gt;“把权重下载下来就能本地跑。”&lt;/p&gt;
&lt;p&gt;“这个模型是开放权重，不是完全开源。”&lt;/p&gt;
&lt;p&gt;“量化之后权重变小了，但效果可能会下降。”&lt;/p&gt;
&lt;p&gt;这些说法里反复出现一个词：&lt;strong&gt;权重（model weights）&lt;/strong&gt;。它听起来很底层，像是机器学习工程师需要关心的东西。但如果你想真正理解大模型是怎么运行的，模型权重其实是最值得先搞清楚的概念之一。&lt;/p&gt;
&lt;p&gt;简单说，&lt;strong&gt;模型权重就是模型训练之后保存下来的大量数值，它们共同构成了模型“学到的能力”&lt;/strong&gt;。这句话很短，但背后有不少东西可以展开。&lt;/p&gt;
&lt;h2 id=&#34;模型不是一段规则而是一大堆参数&#34;&gt;模型不是一段规则，而是一大堆参数&lt;/h2&gt;
&lt;p&gt;很多人第一次接触 AI 时，会下意识地把模型想象成一套规则系统。&lt;/p&gt;
&lt;p&gt;比如：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;如果用户问“法国首都是哪里”，就回答“巴黎”。
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;如果用户问“苹果是什么”，就根据上下文判断是水果还是公司。
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;如果用户要求写诗，就调用某种写诗模板。
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;但现代大语言模型不是这样工作的。&lt;strong&gt;它不是由工程师手写了亿万条规则，也不是一个巨大的问答数据库。它更像是一个巨大的数学函数&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;你输入一段文字，模型把文字切成 token，然后经过一层又一层计算，最后预测下一个 token 最可能是什么。比如你输入：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;巴黎是法国的
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;模型会计算出下一个 token 的概率分布。它可能认为：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;“首都” 概率很高
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;“城市” 概率也不低
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;“总统” 概率很低
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;“香蕉” 概率几乎没有
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;这个判断不是来自某一条明确规则，而是来自模型内部海量参数共同参与的计算。&lt;/p&gt;
&lt;p&gt;这些参数，就是我们说的模型权重。&lt;/p&gt;
&lt;h2 id=&#34;权重到底长什么样&#34;&gt;权重到底长什么样？&lt;/h2&gt;
&lt;p&gt;权重在文件里并不像一本百科全书，也不像一堆可读的句子。它们本质上就是大量数字。&lt;/p&gt;
&lt;p&gt;大概可以想象成这样：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;0.0182
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;-0.4417
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;1.2093
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;0.0008
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;-2.1349
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;...
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;当然，&lt;strong&gt;真实模型里的权重不是简单排成一列，而是组织成很多矩阵和张量&lt;/strong&gt;。Transformer 的不同模块里都有各自的权重，比如注意力层（attention layer）的权重、前馈网络（feed-forward network / FFN）的权重、词嵌入矩阵（token embedding matrix）的权重等等。&lt;/p&gt;
&lt;p&gt;这些名字听起来很工程化，但本质上仍然是一批批数值。它们只是处在模型的不同计算环节纸中：有的负责建模 token 之间的关系，有的负责非线性变换，有的负责把 token 映射成向量表示。&lt;/p&gt;
&lt;p&gt;在直觉上，你可以先把它理解成：&lt;strong&gt;模型内部有无数个旋钮，训练就是调整这些旋钮，权重就是每个旋钮最终停在哪个位置。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;一个 7B 模型，大约有 70 亿个这样的参数。一个 70B 模型，大约有 700 亿个参数。这也是为什么大模型文件那么大，因为你不是下载一段代码，而是在下载几十亿、几百亿个数值。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
