Nufar Gaspar(NLW 旗下 Superintelligent 研究主管)28 分钟一口气讲完的 Agent OS 7 层框架,这里拆细到每一层:意义、文件落点、第一周可做的事、风险清单、工具对照、可粘贴模板。9 篇精读(含 Chief of Staff 完整模板)+ 工具对照表。
写给已经在用 Claude Code / Cursor / Codex,但每次换工具就得重学一遍的人。
视频里 Nufar 抛出了一个核心论断:「每一款智能体工具都在变得跟其他智能体工具一样。所以你选哪个工具的影响越来越小,真正决定差距的是你在它下面搭起来的那套系统。」 她把这套「下面的系统」起了个名字叫 Agent OS(智能体操作系统),把它拆成 7 层,并用一个贯穿示例(Chief of Staff Agent · Chloe)落到每一层。
视频是 28 分钟一口气讲完的,信息密度大、没有可粘贴的样板。这套精读把它拆细到每一层,补齐意义、可行性、落地步骤、风险清单、工具对照、可粘贴模板。9 篇精读 + Chief of Staff 完整模板套件 + 仓库内调研原料,中文社区第一次系统精读这个框架。
┌─ 7. Automations 自动化 ──┐
├─ 6. Verification 校验 │
├─ 5. Connections 连接 │ 能力层
├─ 4. Memory 记忆 │
├─ 3. Skills 技能 │
├─ 2. Context 上下文 │ 知识层
└─ 1. Identity 身份 ────┘ 身份层
贯穿示例:Chief of Staff Agent
每一层都用同一个「首席助理」的实例落地
「Agent OS」 在 2026 年至少有 3 个不同项目同名,本精读只讲第一个:
在 Reddit / HN 搜「Agent OS」, 大部分流量其实流向 #2 和 #3。 推荐他人时记得讲清楚你说的是 #1。
| 编号 | 标题 | 一句话 |
|---|---|---|
| 01 | Identity · 身份层 | AI 第一个读到的文件 |
| 02 | Context · 上下文层 | 通往 AI 价值最快的路径 |
| 03 | Skills · 技能层 | 你重复做的事,写成可复用指令 |
| 04 | Memory · 记忆层 | 让其他每一层都「留下来」的胶水 |
| 05 | Connections · 连接层 | 让 AI 在真实世界里行动 |
| 06 | Verification · 校验层 | 防止 Agent「自信地错」+ 季度回顾 |
| 07 | Automations · 自动化层 | 你不在场时它替你跑(可选) |
| 编号 | 标题 | 一句话 |
|---|---|---|
| 08 | Chief of Staff Agent · 完整模板套件 | 一个周末搭出 v1 |
| 09 | 工具对照表 · 7 层在主流 agentic 工具上落到哪 | Claude Code / Cursor / Codex / OpenCode / Copilot |
| 层 | 名称 | 回答的问题 | 文件落点 | 第一周能做的事 |
|---|---|---|---|---|
| 1 | Identity | 我是谁?哪些规则要永远强制执行? | CLAUDE.md / AGENTS.md / SOUL / copilot-instructions.md | brain dump 一次, 让 AI 面试 15 个问题, 70% 发版 |
| 2 | Context | 我掌握什么知识, AI 不知道? | context/ 下 3-5 份单页 markdown(stakeholders, strategy, operating principles 等) | 列 5 个最常被 AI 搞错的情境, 每个写一页 |
| 3 | Skills | 我重复做什么? | skills/ 下每 Skill 一个 markdown(触发词 + 流程 + 来源 + 输出格式) | 挑 3 个最高频的工作流(周报/会前/邮件)各写一份 |
| 4 | Memory | 跨会话什么应该被记住? | 工具自带记忆 + 你刻意触发的「decision log」「relationship log」 | 直接问你的工具:你的记忆系统怎么工作?你忘什么? |
| 5 | Connections | 让 AI 触达哪些真实系统? | MCP server / CLI / API。从只读开始 | 给日历 + 收件箱只读权限 |
| 6 | Verification | 怎么知道它没在「自信地错」? | 每个 Skill/Agent 配 3-5 项 1 分钟内能跑完的检查 | 写一份「邮件起草质检清单」 |
| 7 | Automations | 它能不能在你不在场时跑? | cron / heartbeat / 工具自带定时 | 先别做, 等下面 6 层稳定后再加 |
如果你只想看核心结论,这里就是:
AGENTS.md 规范 自 2025 年中起逐步成型, 截至 2026 年 Google / OpenAI / Sourcegraph(Amp)/ Cursor / Factory / Devin / Jules / Junie / Warp / Zed 等都已对齐(完整 logo 列表见 agents.md 官网)。 MCP 已经是 Connections 层的事实标准 — 全部主流 agentic 工具(Claude Code / Cursor / Codex / OpenCode / Copilot / Windsurf / Antigravity / Hermes)都支持。把同一份 AGENTS.md 复制到 Cursor / Codex / OpenCode 项目根,它们都会读。Claude Code 是当前唯一逆流(只原生读 CLAUDE.md),需要 @AGENTS.md import 桥接。
详见 09 工具对照表。
「Context 创建是通往 AI 价值最快的路径。」(Nufar)
「他们不再问『我应该用哪个 AI 工具』, 而是开始问『我有哪些知识其实从来没被写下来过』。」
投入 60 分钟写 3 份单页 Context, 比花 6 小时调 Identity 收益大 10 倍。 详见 02 Context。
/review 一级 verification primitive;其他都靠用户自己写 hooks / 外部 CI这两层是 2026 年下半年最值得关注的方向。 04 Memory / 06 Verification 给了即插即用的最小套件。
「没有它, 你的 OS 大概只有 8 周左右的保鲜期就会全面过时。 有了它, 你的 OS 会持续复利, 而且会一直复利下去。」(Nufar)
这是这套方法论的真正难点 — 大多数人在第 2 周搭好前 5 层, 第 8 周发现东西过期, 然后弃坑。 06 Verification 给了月度 retro 的可粘贴 prompt。
第 1 周 · 搭最小可行版(60 分钟): 读 01(Identity)+ 02(Context)+ 08(CoS 完整模板)。今天就开:30 分钟 brain dump 出 Identity v0,列 3-5 份 Context 单页,把 Chief of Staff 目录骨架复制到工作目录。
第 2 周 · 长出 Skills + Memory: 读 03 + 04。每天发现自己「又在重复给 AI 解释一件事」时,把那件事写成一份 Skill。同时刻意触发 AI 把关键决策记入记忆。
第 3 周 · 接通系统 + 上校验: 读 05 + 06。先给 Agent 只读权限,挑 1-2 个高频任务做 3-5 项校验。
第 4 周 · 加自动化 + 复盘: 读 07。给 OS 做第一次回顾,看哪些 Skill 从来没被调用、哪些 Context 文件已过期。
关键日期: 这个系列写于 2026-05-09。视频里 Nufar 反复强调「记忆这条赛道几乎每天都在变化」,这话适用于整个 7 层 — 工具/规范/最佳实践仍在快速迭代。读完它你不会得到答案,但你会得到一份正确的搭建顺序和会自己复利的系统骨架。