Tutorial

AI 101: 什么是模型权重

我们在讨论大模型时，经常会听到这样一些说法： “这个模型有 7B 参数。” “把权重下载下来就能本地跑。” “这个模型是开放权重，不是完全开源。” “量化之后权重变小了，但效果可能会下降。” 这些说法里反复出现一个词：权重（model weights）。它听起来很底层，像是机器学习工程师需要关心的东西。但如果你想真正理解大模型是怎么运行的，模型权重其实是最值得先搞清楚的概念之一。简单说，模型权重就是模型训练之后保存下来的大量数值，它们共同构成了模型“学到的能力”。这句话很短，但背后有不少东西可以展开。模型不是一段规则，而是一大堆参数很多人第一次接触 AI 时，会下意识地把模型想象成一套规则系统。比如：如果用户问“法国首都是哪里”，就回答“巴黎”。如果用户问“苹果是什么”，就根据上下文判断是水果还是公司。如果用户要求写诗，就调用某种写诗模板。但现代大语言模型不是这样工作的。它不是由工程师手写了亿万条规则，也不是一个巨大的问答数据库。它更像是一个巨大的数学函数。你输入一段文字，模型把文字切成 token，然后经过一层又一层计算，最后预测下一个 token 最可能是什么。比如你输入：巴黎是法国的模型会计算出下一个 token 的概率分布。它可能认为： “首都” 概率很高 “城市” 概率也不低 “总统” 概率很低 “香蕉” 概率几乎没有这个判断不是来自某一条明确规则，而是来自模型内部海量参数共同参与的计算。这些参数，就是我们说的模型权重。权重到底长什么样？权重在文件里并不像一本百科全书，也不像一堆可读的句子。它们本质上就是大量数字。大概可以想象成这样： 0.0182 -0.4417 1.2093 0.0008 -2.1349 ... 当然，真实模型里的权重不是简单排成一列，而是组织成很多矩阵和张量。Transformer 的不同模块里都有各自的权重，比如注意力层（attention layer）的权重、前馈网络（feed-forward network / FFN）的权重、词嵌入矩阵（token embedding matrix）的权重等等。这些名字听起来很工程化，但本质上仍然是一批批数值。它们只是处在模型的不同计算环节纸中：有的负责建模 token 之间的关系，有的负责非线性变换，有的负责把 token 映射成向量表示。在直觉上，你可以先把它理解成：模型内部有无数个旋钮，训练就是调整这些旋钮，权重就是每个旋钮最终停在哪个位置。一个 7B 模型，大约有 70 亿个这样的参数。一个 70B 模型，大约有 700 亿个参数。这也是为什么大模型文件那么大，因为你不是下载一段代码，而是在下载几十亿、几百亿个数值。 ...

AI 如何影响人类大脑，研究说了什么

翻译：Transwan 改写：Codex 校对：Carl Cui 关于 AI 如何影响大脑，作者调研了来自国内、外的多项研究，从多个维度探讨了 AI 对于人类认知的影响。作者还在文中附上了参考链接，这些研究的结论并不是一边倒的，有些研究的结论甚至互相冲突，不禁让我联想最近耿同学曝光的学术圈造假丑闻。于是，对于各项研究，我们保持谨慎态度；关于 AI 会对人类产生哪些影响，我们需要进行独立思考。图片来源：Shutterstock 引言从 2023 年 ChatGPT 改变公众对 AI 的想象开始，到 2026 年今天，MIT、Wharton、Harvard、Stanford、Microsoft、OpenAI、Oxford、Google DeepMind，以及中国多所高校的研究者，都在研究同一个问题：AI 聊天机器人到底会怎样影响人的认知、学习和心理状态？这些研究的类型很杂，也很有价值：有脑部扫描和 EEG 实验，有数千人规模的随机对照试验，有纵向调查、荟萃分析（Meta-analysis），也有发生在真实课堂和工作场所里的实地实验。其中既有预印本，也有已经经过同行评审的论文。但问题在于，这些研究常常以孤立新闻的形式出现。一篇论文发布，一个耸动标题刷屏一天，然后很快被下一轮话题淹没。结果是，很多人隐约觉得 AI 可能正在改变我们的思考方式，却很少有人真正看到完整图景。这篇文章试图把这张图拼起来。我汇总了 30 多项研究，逐项看它们到底发现了什么：当我们使用 AI 聊天机器人时，大脑活动、思维方式、学习效果和情感生活会发生哪些变化。更重要的是，我也会指出目前科学界还不知道什么。最终浮现出来的是一个悖论。这个悖论会影响政策制定、产品设计、个人使用习惯，以及我们整体上如何和这项既令人兴奋又令人不安的新技术相处。 I. 你的大脑活动会下降目前已经有少量但不断增加的研究，把人放进脑部扫描仪，或在他们使用 ChatGPT 时佩戴 EEG 传感器。相比自我报告和普通行为测试，神经影像学工具更接近直接观察大脑活动，因此这些研究虽然样本量通常不大，却很值得关注。 Your Brain on ChatGPT，Kosmyna 等人（arXiv 预印本，2025，N=54）：MIT Media Lab 用 32 通道 EEG 跟踪三组参与者数月内的写作过程：ChatGPT 用户、Google 搜索用户和无辅助写作者。结果显示，ChatGPT 组的神经连接最弱，比无辅助写作者低最高约 55%。随着实验推进，他们越来越依赖复制粘贴。到了第 4 阶段，当 ChatGPT 组被要求独立写作时，大脑活动仍然处于受抑状态，研究者称之为“认知债务”。相反，原本无辅助写作的人在第 4 阶段首次使用 ChatGPT 时，大脑连接反而增强。Kosmyna 的总结很关键：“时机可能很重要。” Lower engagement of cognitive control, attention, modulation networks and lower creativity in children while using ChatGPT，Horowitz-Kraus 等人（bioRxiv 预印本，2025，N=31）：这是目前少见的使用 fMRI 同时观察儿童和成人与聊天机器人互动时大脑活动的研究。成年人在认知控制网络中表现出更强的网络内连接；儿童则在认知控制、注意力和调节网络上的参与度较低。这暗示儿童大脑可能比成人更容易受到 AI 使用方式的影响。 EEG during creative design with AI tools，Wang 等人（Frontiers in Psychology，2025，N=64）：这项研究给出了相反方向的证据。使用 ChatGPT、Midjourney、Stable Diffusion 等 AI 创意工具的设计专业学生，比使用传统软件的对照组表现出更高的专注度和更好的创意表现。关键区别在于，他们不是被动接收答案，而是在主动指挥 AI 作为创意工具。 Effects of different AI-driven chatbot feedback on learning outcomes and brain activity，Yin 等人（Nature portfolio，2025，N=87）：研究者用 fNIRS 测量学生和聊天机器人互动时的大脑激活情况。不同反馈方式会激活不同区域。元认知反馈，比如“你为什么认为那是答案？”，会增加额极区激活，并与更高的迁移分数相关；中性反馈则更多激活背外侧前额叶皮层。换句话说，聊天机器人怎么和你说话，会改变你的大脑怎么工作。 NeuroChat: A neuroadaptive AI chatbot for customizing learning experiences，Baradari 等人（arXiv 预印本，2025，N=24）：MIT Media Lab 做了一个能实时监测 EEG 的原型系统。当它检测到参与度下降时，会调整回复方式。相比标准聊天机器人，它显著提升了 EEG 测得的参与度和自我报告参与感，但没有改善短期学习结果。这说明“认知脱离”不是不可避免的，产品设计可以介入。结论：大脑成像证据仍处在早期阶段，样本量小，预印本多，而且结果并不完全一致。但整体模式已经比较清楚：被动使用 AI，也就是让 AI 直接给答案，往往会降低与费力思考相关的大脑参与；主动使用 AI，也就是把它当作需要你指挥和挑战的工具，则可能维持甚至提高参与度。关键变量不是有没有 AI，而是 AI 到底要求你的大脑做什么。当 AI 替你思考时，你的大脑自然会少做一些。 ...

AI 101：10 个概念看懂人工智能

我们经常听到这样一些术语：LLM、Agent、向量数据库、tokens、embeddings、RAG，等等。大多数文章会跳过这些基本知识，围绕某个概念直接展开。实际上，理解了这些核心概念，AI 会变得容易很多。这篇文章主要普及 10 个最重要的 AI 概念，同时会附上相关的资料。 1. Tokens - 文本信息处理的基本单位 AI 模型在理解一个句子之前，并不是像我们人类那样去阅读它，它首先把句子分成一个个小片段，这些小片段就叫做 token。 Token 的正式译法是词元。2026 年 3 月，全国科学技术名词审定委员会与国家数据局正式将 token 在人工智能领域的中文名称确定为“词元”。我们会把句子当成一个完整的语义来理解，但 AI 是一个 token 一个 token 地处理。跟 AI 模型聊天时，我们输入一句话，它看到的是一连串的 token。一般来说，一个英文单词大约对应 1 ~ 2 个 token，而一个中文字符大约对应 1 ~ 3 个 token。例如毛主席的这句话：“世界是你们的，也是我们的，但是归根结底还是你们的”，包括标点在内共 24 个字符，在 GPT-5 中对应 16 个 token： AI 通过 token 来衡量一切：输入大小输出大小价格上下文窗口记忆 1.1 尝试 Tokenization 你可以通过下面两个在线词元分词器（Tokenizer）来尝试词元切分（tokenization）： OpenAI Tokenizer Tiktokenizer 2. Embeddings - AI 如何理解语义在词元切分（tokenization）后，文本被转换为一连串数字（见下图），这些数字被称为“词嵌入”或“词向量”（embeddings）。Embeddings 通过数学方式来表示语义，想象一个包含很多词语的集合： ...

2026 年本地 AI 机器构建指南

译者：Carl Cui 听着，我懂。在 2024 年，每个人都在购买云端 API token，好像它们即将过时一样。“哦，直接调用 API 就行！”他们说。“太方便了！”他们说。好吧，如果你在 2026 年还在按 token 付费，恭喜你，你很可能在为不拥有自己的 AI 技术栈而支付溢价。让我告诉你一件事：本地 AI 不再是奢侈品，而是生存策略。读完这篇文章，你会确切知道该构建什么样的机器，既不会超出预算，也不会让你发疯。第一部分：为什么选择本地 AI？在谈论 token 之前……先谈谈隐私这里很少有人问的问题：你真的愿意把你的密码和信用卡信息交给某个第三方 API 吗？想想看。每次你通过云端调用 LLM 时，你都在信任：你的数据会发送给陌生人（AI 公司）你的提示词可能被保存为“机密” 你的 agent 记忆存储在你不控制的服务器上最要命的是：你自己的 agent 记忆是关键。当你运行本地 AI 时，你的 agent 会随着时间的推移构建上下文——它会记住你在意什么、你之前问过什么、什么对你重要。使用云端 API 时，除非你明确告诉它们要记住，否则这些历史记录通常分散在不同的服务中。使用本地 AI：你的记忆保持属于你（不是租来的）不需要每个月“重置”你的 agent 上下文敏感数据不会泄露，因为……嗯，它根本不会泄露到任何地方！它就在那里，在你的机器里现在让我们谈谈实际成本。因为是的，隐私很重要——但钱也很重要。这是 2024–2025 年没人告诉你的：按 token 定价是个陷阱。而且从那以后情况变得更糟。问题不仅仅是模型说得更多（它们确实如此——现代 agent 喜欢滔滔不绝）。而是你既要为输入 token 付费，又要为输出 token 单独付费。这意味着： ...

理解 AI Agent：动手搓一个就懂了

进入 2026 年，AI Agent 越来越频繁地出现在我们的视野里，那到底什么是 AI Agent？举个例子，3 月份爆火的 OpenClaw “小龙虾”，本质上是一个 AI Agent；开发人员最常用的 AI 辅助编程工具 Claude Code 和 Codex，本质上也是 AI Agent。OpenClaw 和 Claude Code 功能全面，代码量也庞大。这篇文章，我们会一步一步构建一个最小版本的编码 Agent，以此建立对 AI Agent 的直观感受。 1. 四步构建法文章按照下面 4 个步骤来构建 agent：接入 LLM；添加工具；构建 agent 循环；构建对话循环；不论实现的 agent 执行什么任务，都可以采用这样的 4 个步骤来构建。 2. 实现编码 Agent Agent 可以使用我们熟悉的任何语言来实现，例如 TypeScript，Python，Rust 等等，只要它接入 LLM 方便，可以调用 shell 命令工具就行。这里我们选择 Python。完整的示例代码已经上传到 GitHub，链接在文章后面 2.0 项目设置 # 如果没有安装 uv，先安装它 pip install uv # 初始化 uv 环境 uv init 2.1 接入 LLM LLM 选择了 Kimi，Kimi 开放平台注册的账号在完成个人认证后会收到 15¥ 赠送额度，拿来演示够用了。Kimi 开放平台兼容 OpenAI 协议，可以直接使用 OpenAI SDK 接入。 ...

如何编写真正有效的 AI Agent Skill：SKILL.md 模式详解

作者：Bibek Poudel 译者：Carl Cui 如果你写的 skill 没有触发，问题基本上都出在元数据的 description 部分，而不在 skill 内容本身。不少人都有类似的经历：写了一个 SKILL.md，将其放在正确的文件夹中，要求 agent 使用它，但是啥反应也没有。修改了 skill 内容，仍然没有效果。问题从来不是 skill 本身的内容，而是 agent 用来决定是否激活它开头的那两行。在本指南中，我先讲解 Agent Skills 工作原理，指出为什么大多数人会写错，然后从简单到复杂构建四个 skill：一个 README 编写器、一个 git 提交消息生成器、一个代码审查器和一个完整的 MCP 驱动的冲刺规划器。什么是 Agent Skill？ Skill 不是插件，也不是访问 API 的脚本。我们可以把它当作为团队新成员编写的入职指南。与其在每次跟 agent 对话时重新解释你的工作流程和偏好，不如将它们打包起来丢给 agent，让它根据你的请求自动加载。本质上，skill 以一个文件夹的形式存在： your-skill-name/ ├── SKILL.md # 必需：指令 + 元数据 ├── scripts/ # 可选：agent 运行的可执行代码 ├── references/ # 可选：仅在需要时加载的文档 └── assets/ # 可选：模板、图片、字体唯一必需的文件是 SKILL.md。其他所有内容都是可选的，但随着 skill 复杂度的增加而变得重要。 SKILL.md 格式是一个开放标准，由 Anthropic 于 2025 年 12 月在 agentskills.io 发布。它适用于 Claude Code、OpenAI Codex 和 OpenClaw。虽然格式是标准化的，但每个平台在发现和工具调用方面的实现略有不同。可以理解为同一编程语言，经过不同编译器编译后，结果不是完全相同的。在 Claude Code 上有效的 skill 很可能在 Codex 上也有效，但运行时行为（如 session snapshotting、工具权限和调用模式）在不同平台之间有所不同。 ...

IronClaw 折腾日记 - 配置 Gmail 工具

IronClaw 在 0.25.0 版本解决了一系列与 OAuth 有关的 bug，配置好 Gmail 工具后，不会出现 OAuth 认证频繁失效的问题了。这篇文章记录为 IronClaw 配置 Gmail 工具的完整过程。 1. 背后的考量 1.1 为什么选择 IronClaw IronClaw 从设计之初对安全考虑的比较充分，采用了基于 wasm 组件的隔离机制（参考之前写过的名为 IronClaw 安全机制解析的文章）。并且 IronClaw 采用 Rust 实现，Rust 是我个人长期关注的编程语言，尽管它的学习曲线陡峭是公认的，但在 debug 过各种“奇葩问题”，并且见过一些所谓资深程序员堆的“屎山”后，我才觉得 Rust 未来大有可为：不是因为人们津津乐道的“内存安全”，而是因为它在软件工程学方面向前迈了一大步。 AI 生成代码日益成熟，淡化了 Rust 在软件工程学方面的优势，不过同样地，学习曲线也不再成为采用 Rust 的主要障碍。 1.2 为什么接入 Gmail 而不是国内邮件厂商对于经常混迹国外计算机技术网站、论坛的开发人员，Gmail 邮箱应该是必备的：基本所有网站，比如 Reddit、ChatGPT 都可以直接用 Gmail 账号登入；另外用国外邮箱接收国外各类技术订阅邮件也会很方便。 1.3 如何在接入 AI 助手的同时，保护个人信息到目前为止，我个人常用的 Gmail 邮箱中除了越来越多的技术订阅邮件，还有个人信息混杂其中。我想让 AI 助手帮忙整理分析技术订阅邮件，又不想让它接触含个人信息，怎么办？我的做法是：新建一个 Gmail 邮箱，在常用 Gmail 邮箱中添加邮件过滤规则，将满足规则的邮件转发给新建的 Gmail 邮箱，把新建的 Gmail 邮箱丢给 IronClaw。只要规则设置得当，就不用担心 IronClaw 背后的 LLM 触及个人敏感信息。 ...

如何基于 .wit 文件生成 rust 代码

IronClaw 采用 wasm 沙箱隔离作为其安全机制，IronClaw 宿主和沙箱之间的交互接口是在 .wit 文件中定义的，例如 channel.wit of IronClaw。这篇文章回答一个问题：如何基于定义好的 wit 文件生成 rust 代码？ wit-bindgen 是 Bytecode Alliance 开发的官方工具，它能将 .wit 文件中定义的接口转换为 Rust 代码。它主要有两种使用方式：在 build.rs 构建脚本中使用命令行工具或在代码中使用 wit-bindgen 库的宏方法一：在 build.rs 中使用 CLI 工具（wit-bindgen-cli）这种方式在构建时生成一次绑定文件（例如 bindings.rs），之后可以作为常规 Rust 模块引入。 1. 添加依赖在 Cargo.toml 中，将 wit-bindgen-cli 添加到 build-dependencies，并把生成的 bindings.rs 包含在 lib.rs 中： # Cargo.toml [package] # ... build = "build.rs" [lib] # 声明生成的 bindings 模块 path = "src/lib.rs" [build-dependencies] wit-bindgen-cli = "0.28.0" // src/lib.rs // 声明由 build.rs 生成的 bindings 模块 mod bindings; pub use bindings::*; 2. 编写构建脚本 (build.rs) 在项目根目录下创建 build.rs，使用 wit_bindgen_cli::generate! 宏处理 .wit 文件。 ...

NotebookLM：给学习开个 AI 外挂

1. 什么是 NotebookLM NotebookLM 是谷歌推出的一款基于用户资料的 AI 辅助研究/学习工具。它不能像通用聊天机器人那样直接回答所有问题，而是需要用户先上传自己的资料，例如 PDF、网站、视频、音频、文档等等，然后它基于这些资料快速总结、整理笔记，变身成为用户最关注领域的个性化 AI 专家。这一切是基于 Gemini 的多模态理解能力实现的。与其他 AI 辅助的记事应用不同，NotebookLM 的优势在于以来源为依据。用户可以放心地使用 NotebookLM 的回答，因为它会严格参考上传的来源，从而降低 AI 生成不实信息的风险。除用户控制来源外，NotebookLM 还有下面这些优势：信息整合效率：NotebookLM 可理解、整合海量文字，并显著加快从中挖掘分析洞见的过程个性化学习：NotebookLM 会根据用户的具体需求和内容，为用户营造高度个性化的学习和研究环境并且，NotebookLM 还能根据上传的资料生成不同内容，例如播客风格的音频概览、幻灯片等等，激发用户的灵感，辅助打造创意项目。 2. 如何使用 NotebookLM 安卓和苹果用户可以下载 NotebookLM 应用：电脑用户目前需要通过浏览器使用 NotebookLM： NotebookLM 目前支持 4 种使用方案，免费的试用版本即可满足大部分人的需求。 Plus、Pro 和 Ultra 版本会限制地区，国内用户肯定是受到限制的。 3. NoteBookLM 使用场景在日常工作中，用户可以这样使用 NotebookLM：开工前的文档审核助理 - 开始工作前，上传会议记录、报告等资料，让 NotebookLM 帮助分析并为全天工作做好准备促进高效研究的得力助手 - NotebookLM 不仅能节省“搜索答案”的时间，还能根据来源帮助厘清概念、辅助撰写邮件、准备提案，并汇总相关分析洞见助力学习和规划的智能伙伴 - 关键概念、定义和事实会自动转化为抽认卡，NotebookLM 也会根据上传的资料生成测验，完成测验后生成动态报告，辅助用户应对会议或考试进行每日复盘和规划的贴心管家 - NotebookLM 可梳理当日笔记要点，并生成待办事项清单等材料 ...

个人站点安全防护

在个人服务器上搭建网站，对于计划长期运行的站点，有一个问题是必须要考虑的，那就是站点的安全问题。这里介绍一些基本的防护手段。防护的核心原则是：在保持服务可访问的前提下，最大限度地缩小攻击面，并建立多层防御。 1. 核心端口功能与风险通常 Web 服务器会开放 22/80/443 这三个端口，我们了解下每个端口的主要风险点： 22 (SSH)：管理的大门。主要风险是暴力破解和弱口令。一旦被攻破，服务器就易主了； 80/443 (Web)：服务的脸面。主要风险是Web应用漏洞（如SQL注入）、DDoS攻击和CC攻击；所有端口：都存在基于软件漏洞的0-day攻击风险，以及系统配置不当带来的隐患； 2. 个人服务器分层防护第一层：访问控制与最小化原则（最基础也最有效）这部分是必须做的，能挡住绝大多数自动化攻击。 SSH 端口安全（关键！）禁用密码登录，改用密钥对：这是最重要的一步。密码很容易被暴力破解，而密钥对几乎无法被暴力枚举。操作：修改 /etc/ssh/sshd_config，设置 PasswordAuthentication no。更改默认端口（可选但推荐）：将 SSH 服务从默认端口 22 改为一个高位端口（如2222）。这并不能防住定向攻击，但能瞬间避开 99% 的自动化扫描和攻击脚本。操作：修改 /etc/ssh/sshd_config，设置 Port 2222。安装 Fail2ban：这是一个必备工具。它会监控 SSH 日志，当发现同一个 IP 多次登录失败后，自动将其加入防火墙黑名单一段时间，能有效遏制暴力破解。配置：重点监控SSH服务，设置合适的maxretry（重试次数）和bantime（封禁时间）。防火墙配置只开放必要端口：使用防火墙，只放行你需要对外提供的端口（80， 443， 22（或你修改后的 SSH 端口））。通常，云服务提供商会提供默认的防火墙功能，通过云服务控制台即可完成配置。如果需要手动配置服务器防火墙（一般是 ufw 或者 firewalld），可以将默认策略配置为“DROP”，然后只放行需要对外提供的端口。命令示例（ufw）： sudo ufw default deny incoming sudo ufw default allow outgoing sudo ufw allow 80/tcp sudo ufw allow 443/tcp sudo ufw allow 2222/tcp # 假设SSH改到了2222端口 sudo ufw enable 注意：优先选择云服务厂商提供的防火墙，而非 ufw，具体原因下面会提到。 ...