Agent OS · 智能体操作系统的 7 层精读

写给已经在用 Claude Code / Cursor / Codex,但每次换工具就得重学一遍的人。

视频里 Nufar 抛出了一个核心论断:「每一款智能体工具都在变得跟其他智能体工具一样。所以你选哪个工具的影响越来越小,真正决定差距的是你在它下面搭起来的那套系统。」 她把这套「下面的系统」起了个名字叫 Agent OS(智能体操作系统),把它拆成 7 层,并用一个贯穿示例(Chief of Staff Agent · Chloe)落到每一层。

视频是 28 分钟一口气讲完的,信息密度大、没有可粘贴的样板。这套精读把它拆细到每一层,补齐意义、可行性、落地步骤、风险清单、工具对照、可粘贴模板。9 篇精读 + Chief of Staff 完整模板套件 + 仓库内调研原料,中文社区第一次系统精读这个框架。

7 层全景

┌─ 7. Automations    自动化 ──┐
├─ 6. Verification   校验      │
├─ 5. Connections    连接      │  能力层
├─ 4. Memory         记忆      │
├─ 3. Skills         技能      │
├─ 2. Context        上下文    │  知识层
└─ 1. Identity       身份 ────┘  身份层

   贯穿示例:Chief of Staff Agent
   每一层都用同一个「首席助理」的实例落地

⚠️ 重名澄清

「Agent OS」在 2026 年至少有 3 个不同项目同名,本精读只讲第一个:

Nufar Gaspar / AIDB 的 7 层个人框架(本精读对象)
Brian Casel / Buildermethods 的 agent-os(围绕编程 agent 的开源框架,完全不同范畴)
Letta / AIOS 学术线(LLM 即操作系统的研究方向)

在 Reddit / HN 搜「Agent OS」, 大部分流量其实流向 #2 和 #3。推荐他人时记得讲清楚你说的是 #1。

阅读地图

主线(按这个顺序读最稳)

编号	标题	一句话
01	Identity · 身份层	AI 第一个读到的文件
02	Context · 上下文层	通往 AI 价值最快的路径
03	Skills · 技能层	你重复做的事,写成可复用指令
04	Memory · 记忆层	让其他每一层都「留下来」的胶水
05	Connections · 连接层	让 AI 在真实世界里行动
06	Verification · 校验层	防止 Agent「自信地错」+ 季度回顾
07	Automations · 自动化层	你不在场时它替你跑(可选)

实操配套

编号	标题	一句话
08	Chief of Staff Agent · 完整模板套件	一个周末搭出 v1
09	工具对照表 · 7 层在主流 agentic 工具上落到哪	Claude Code / Cursor / Codex / OpenCode / Copilot

7 层各自要回答的问题(全景速查表)

层	名称	回答的问题	文件落点	第一周能做的事
1	Identity	我是谁?哪些规则要永远强制执行?	`CLAUDE.md` / `AGENTS.md` / `SOUL` / `copilot-instructions.md`	brain dump 一次, 让 AI 面试 15 个问题, 70% 发版
2	Context	我掌握什么知识, AI 不知道?	`context/` 下 3-5 份单页 markdown(stakeholders, strategy, operating principles 等)	列 5 个最常被 AI 搞错的情境, 每个写一页
3	Skills	我重复做什么?	`skills/` 下每 Skill 一个 markdown(触发词 + 流程 + 来源 + 输出格式)	挑 3 个最高频的工作流(周报/会前/邮件)各写一份
4	Memory	跨会话什么应该被记住?	工具自带记忆 + 你刻意触发的「decision log」「relationship log」	直接问你的工具:你的记忆系统怎么工作?你忘什么?
5	Connections	让 AI 触达哪些真实系统?	MCP server / CLI / API。从只读开始	给日历 + 收件箱只读权限
6	Verification	怎么知道它没在「自信地错」?	每个 Skill/Agent 配 3-5 项 1 分钟内能跑完的检查	写一份「邮件起草质检清单」
7	Automations	它能不能在你不在场时跑?	cron / heartbeat / 工具自带定时	先别做, 等下面 6 层稳定后再加

几条贯穿全系列的判断

如果你只想看核心结论,这里就是:

1. 「工具收敛」是事实,不是营销话术

AGENTS.md 规范自 2025 年中起逐步成型, 截至 2026 年 Google / OpenAI / Sourcegraph(Amp)/ Cursor / Factory / Devin / Jules / Junie / Warp / Zed 等都已对齐(完整 logo 列表见 agents.md 官网)。 MCP 已经是 Connections 层的事实标准 — 全部主流 agentic 工具(Claude Code / Cursor / Codex / OpenCode / Copilot / Windsurf / Antigravity / Hermes)都支持。把同一份 AGENTS.md 复制到 Cursor / Codex / OpenCode 项目根,它们都会读。Claude Code 是当前唯一逆流(只原生读 CLAUDE.md),需要 @AGENTS.md import 桥接。

详见 09 工具对照表。

2. Context 是 ROI 最高的一层,但大多数人花在 Identity 上

「Context 创建是通往 AI 价值最快的路径。」(Nufar)

「他们不再问『我应该用哪个 AI 工具』, 而是开始问『我有哪些知识其实从来没被写下来过』。」

投入 60 分钟写 3 份单页 Context, 比花 6 小时调 Identity 收益大 10 倍。详见 02 Context。

3. 7 层里业内最弱的两层是 Memory 和 Verification

Memory — OpenCode / Copilot 至今没有原生跨会话记忆;Claude Code v2.1.59+ 才有 automemory + Auto Dream
Verification — 我们调研的 9 款 agentic 工具(Claude Code / Cursor / Codex / OpenCode / Copilot / Windsurf / Antigravity / Workspace Agents / Hermes)中, 只有 OpenAI Codex 内建 /review 一级 verification primitive;其他都靠用户自己写 hooks / 外部 CI

这两层是 2026 年下半年最值得关注的方向。 04 Memory / 06 Verification 给了即插即用的最小套件。

4. 没有 Verification + 月度 retrospective,OS 大概 8 周就过期

「没有它, 你的 OS 大概只有 8 周左右的保鲜期就会全面过时。有了它, 你的 OS 会持续复利, 而且会一直复利下去。」(Nufar)

这是这套方法论的真正难点 — 大多数人在第 2 周搭好前 5 层, 第 8 周发现东西过期, 然后弃坑。 06 Verification 给了月度 retro 的可粘贴 prompt。

5. 关键事实(已校验)

视频本体: YouTube ntvkDnk_5jA, 2026-04-25 发布, 28,110 views / 771 likes, 28:36
Nufar Gaspar: 前 Intel AI Solutions Group 高级总监, 现 NLW 旗下 Superintelligent 公司 Head of Research
AIDB Agent OS: 免费报名 aidbagentos.ai, 实际是 12 个项目(00-11), 视频里说「10」是口误
MCP 当前规范: 2025-11-25
录制时间锚点: OpenAI Workspace Agents(2026-04-22)、Claude Code automemory(v2.1.59+, 2026-02-26)、Cursor Agents/Automations(2026 GA)、Hermes(140K stars,NousResearch/hermes-agent 于 2025-07-22 开源)

这套精读没在做的事

❌ 「应该用哪款工具」的指南。视频和译者都明确反对这个问题。工具收敛是事实,选哪个都行。
❌ 现成的、不用思考的全套文件。Identity 必须由你自己 brain dump 出来 — AI 替你写的初稿是起点不是终点。
❌ 企业级权限/治理的最佳实践。这一期主要面向个人搭建。组织级铺开 Nufar 在视频里直接说留给 Enterprise Claude 项目了, 不在本精读范围。

译者立场声明

本精读基于公开发布的 AI Daily Brief 视频。所有引用均双语对照、标注时间戳和原文出处。
7 层框架的命名权归 Nufar Gaspar / AIDB,我不主张原创。本系列的价值在于拆解、补强、对照、落地。
对中文创作者权益敏感:文中引用的中文同主题文章只做点评 + 关键金句 + 推荐阅读,不复制全文。
全部细节请回到视频原片 + Nufar 的免费项目自行验证。

关键日期: 这个系列写于 2026-05-09。视频里 Nufar 反复强调「记忆这条赛道几乎每天都在变化」,这话适用于整个 7 层 — 工具/规范/最佳实践仍在快速迭代。读完它你不会得到答案,但你会得到一份正确的搭建顺序和会自己复利的系统骨架。

Agent OS · 智能体操作系统的 7 层精读 & AGENT-OS-7-LAYERS