0
· OBSIDIAN-EVOLVED · 2026.05.10 · 26 MIN ·

Khoj 深度:为什么 34K stars 的「AI 第二大脑」值得认真对待

Khoj 是 self-host AI 第二大脑赛道里产品形态最完整的方案 —— 6 端原生客户端 + Custom Agents + Automations 同时做到。本文横评 AnythingLLM / PrivateGPT / Reor / NotebookLM,给出独立用户的决策树。 · by 思扬

核心问题:你听说过 Khoj 也试装过 NotebookLM,但当 NotebookLM 还要把你的笔记上传 Google,Khoj 是不是真的能完全本地代替?它到底能做什么、不能做什么、跟 AnythingLLM / PrivateGPT / Reor 比谁更适合你?

这一篇拆四件事:① Khoj 是什么、为什么 34K stars(自核于 2026-05-10)② 完整能力清单 + 真实优缺点 + 已知限制 ③ 同类 self-host AI 第二大脑横评(AnythingLLM / PrivateGPT / Reor / NotebookLM)④ 给”个人独立用户”的决策树

🔍 可信度声明(2026-05-10 自核):Khoj 及竞品所有 GitHub stars 通过 GitHub API 直接拉取(curl,绕过 agent 二手转述);特性描述以插件官方 README + 官方文档 为主、二手评测为辅(均显式标注来源);批评意见保留 Hacker News 原帖链接以便后续追溯。AI 工具迭代快,任何超过 3 个月的本文事实需要重新自核


🔥 影响力卡片

Khoj 自核数据(2026-05-10,直拉 GitHub API)

数据来源
GitHub stars34,477api.github.com/repos/khoj-ai/khoj
Forks2,191同上
Watchers / Subscribers166同上
Created2021-08-16同上(已 4 年+ 持续维护)
Last push2026-03-26同上(在维护,但比同类略缓)
Open issues99同上
主语言Python同上
Discord 服务器 ID1112065956647284756README badge
姐妹产品 Pipali124 stars(2026-05-03)github.com/khoj-ai/pipali

核心横评(self-host AI 第二大脑同类)

项目Stars(2026-05-10)上次 push定位
AnythingLLM(Mintplex-Labs)59,7922026-05-09”all-in-one AI app” + 多用户 + workspace
PrivateGPT(zylon-ai)57,2092026-02-26100% 本地 + 纯文档 QA + 无 agent/multi-user
LlamaIndex(run-llama,框架不是产品)49,2802026-05-09document agent + OCR 平台,RAG 框架
Khoj(khoj-ai)34,4772026-03-266 端覆盖 + agent + 自动化 + 个人 AI 助手
Reor(reorproject)8,5592025-05-13(12 个月停滞 ⚠️)“Obsidian alternative + AI built-in”

关键判断:Khoj 在 stars 数上不是第一,但定位最独特 —— 是这个表里唯一同时做到 ① 自托管开源 ② 6 端原生客户端 ③ AI 个人助手而非纯 RAG 框架 ④ 内建 agent + automation 的产品。


🎯 为什么必读

三个新事实,如果你之前只看过”Top open-source AI”列表大概率漏掉:

  1. Khoj 是这个赛道里”产品形态最完整”的 self-host 方案。AnythingLLM 偏团队工作区、PrivateGPT 偏纯本地 QA、LlamaIndex 是框架。Khoj 是唯一一个直接说”它就是你的个人 AI 助手”+ 4+ 年持续迭代。

  2. 6 端原生客户端在 2026 仍是稀缺资产。Browser / Obsidian / Emacs / Desktop / Phone / WhatsApp —— 不是浏览器套壳,是 6 个真实开发的客户端。这件事工程量极大,小厂玩不起

  3. 2026 它做了战略扩展 — 推出 Pipali(2026-Q2 起,124 stars)。Pipali 是”在你电脑上跑的 AI 同事”(read-write files, code safely in sandbox, use your browser)。Khoj 不再只是”问答你的笔记”,在向 Claude Code / Cursor 这种”agent harness”方向延伸。

如果你已经在用 Obsidian + Smart Connections + Copilot(详见第 22 篇:Obsidian 与 AI),你会问:还要 Khoj 干嘛?答案在 §6 决策树


一句话总结

Khoj 是”如果 NotebookLM 是开源的、能完全跑在你电脑上、还内建 agent 和自动化”的形态 —— 它的核心价值不是”chat with docs”,是”个人 AI 在 6 个端长期陪你”。


💎 金句墙

“Khoj’s superpower lies in its ability to be self-hosted, allowing you to run it entirely on your own machine, keeping your data strictly within your control.” “Khoj 的超能力在于它能自托管 —— 让你把全部跑在你自己机器上,数据严格留在你的控制内。” —— i-scoop.eu, “Khoj, the Open-Source Second Brain and Research Copilot” —— 🟢 译者点评:这是 Khoj 的核心 sell。 NotebookLM 也答可以”对话”,但你的笔记必须传 Google;ChatGPT Memory 也答可以”长期记忆”,但你不知道它存了你什么。Khoj 是为数不多让你完全控制数据 + 完全控制模型的方案。这条 selling 在 2026 越来越值钱。

“What sets Khoj apart from competitors like Google’s NotebookLM is its commitment to open-source principles and privacy … you are not forced to upload your sensitive data to a big tech cloud.” “Khoj 与 Google NotebookLM 的差异在于其对开源原则与隐私的承诺 —— 你不被强迫把敏感数据上传到大厂云。” —— i-scoop.eu, 同上 —— 🟢 译者点评:这是对 NotebookLM 用户最直接的对话。NotebookLM 做了很好的”AI summarize my docs”体验,但它的 ToS 允许 Google 用你的数据。Khoj 不仅模型可换,部署也在你机器上。对律师 / 医生 / 政府承包商,这是法律层面的差别,不是体验层面

“Khoj is open-source, self-hostable. Always.” —— Khoj 官方 README —— 🟢 译者点评:关键词是 “Always”。Khoj 在做云端商业化(app.khoj.dev + Enterprise),但同时承诺核心永远开源、永远可自托管。这是和”开源诱饵 → 后期闭源”模式的明确切割。

“Khoj has grown to support more content types, deeper integrations and chat using ChatGPT, and with Llama 2’s release, chat models became feasible enough to use on consumer hardware.” —— Hacker News #36933452(2023-08,Llama 2 发布时) —— 🟢 译者点评:这条 HN 评论是 Khoj 转折点的实时记录。2023 年 Llama 2 发布之前,Khoj 主要是”语义搜索 + 部分聊天”,2023 年 8 月之后才真正成为”个人 AI 助手”。Khoj 的 4+ 年生命跨越了 RAG 时代和 LLM 时代两段 —— 这种”穿过技术换代”的项目,基础设施往往更扎实。


📋 核心精读

1. Khoj 是什么 — 完整能力清单

按 README 直接列出(译者标注重要程度 ⭐⭐⭐):

1.1 对话与 RAG ⭐⭐⭐(核心)

  • 对接任意 LLM:本地 Ollama(llama3 / qwen / gemma / mistral)+ 云端(GPT / Claude / Gemini / DeepSeek)
  • 从你的文档检索后回答:image / pdf / markdown / org-mode(Emacs 用户友好)/ word / notion files
  • 从互联网检索:web search 内置,不依赖 Bing API key
  • 对话即检索:每条问答自动 RAG,带源笔记引用

1.2 多端原生客户端 ⭐⭐⭐(差异化)

  • Browser:khoj.dev / app.khoj.dev
  • Obsidian:Khoj 插件 — 在 Obsidian 内调用
  • Emacs:org-mode 用户原生支持
  • Desktop:macOS / Windows / Linux 桌面应用
  • Phone:iOS / Android
  • WhatsApp:聊天机器人接入

1.3 Custom Agents ⭐⭐(独家)

  • 自定义角色 / 知识库 / 工具 / 模型
  • 一个 vault 可以有多个 agent(写作教练 / 研究助手 / 法律顾问)
  • README 直引:“Create agents with custom knowledge, persona, chat model and tools to take on any role”

1.4 Automations ⭐⭐(差异化)

  • 后台计划任务:主动而非被动
  • “Personal newsletters and smart notifications delivered to your inbox”
  • 把 Khoj 从”问我才答”变成”它主动给我”

1.5 Semantic search ⭐⭐(基础设施)

  • 跨所有连接的文档源 + 笔记
  • README 称为 “advanced semantic search”

1.6 多模态 ⭐(增量)

  • 生成图片(via 配置的图片模型)
  • “Talk out loud, play your messages”(语音输出)

2. 为什么这么火 — 5 个具体原因

① 开源 + 永远自托管承诺(SaaS 时代稀缺)

README 一句”Khoj is open-source, self-hostable. Always”。在 SaaS 收割时代,这种公开承诺有营销价值,也有用户保留价值。

② 模型无关 + 不锁定厂商

支持的 LLM 列表(README 直引):llama3, qwen, gemma, mistral, gpt, claude, gemini, deepseek。 不像 ChatGPT Memory 只能用 OpenAI、不像 Claude Projects 只能用 Anthropic、不像 NotebookLM 只能用 Gemini。模型出新就能切

③ 4+ 年持续迭代,跨 RAG → LLM 时代

Created 2021-08-16,now is 2026-05。4 年 9 个月持续维护,跨过 RAG 时代和 LLM 时代两段。HN 上有用户的实时记录:2023-08 Llama 2 发布让本地 chat models “变得可用”。这种”穿越技术换代”的项目,基础设施往往更扎实。

④ 6 端原生客户端 — 工程量极大

不是”一个 web app + iOS 套壳”,是 6 个真实开发的原生客户端(Browser / Obsidian / Emacs / Desktop / Phone / WhatsApp)。Emacs + WhatsApp 两个都属小众,做了说明对该群体认真

⑤ Pipali 战略扩展(2026-Q2)

README 显著位置宣告新产品 Pipali(124 stars):“AI coworker that runs on your computer … can read-write files, code safely in sandbox, use your browser”。这是从”问答助手”向”agent harness”扩展 —— 跟上 Claude Code / Cursor 的步伐


3. 优点深度评测

3.1 真隐私(不是营销话术)

  • 自托管 → vault 内容不出本机
  • 与本地 Ollama 配合 → 数据 + 模型全本地
  • 对照 NotebookLM:NotebookLM 必须把笔记上传 Google,Khoj 不必

3.2 客户端覆盖在同类里第一

项目BrowserObsidianEmacsDesktopPhoneWhatsApp
Khoj
AnythingLLM✅(Electron)
PrivateGPT✅(API/CLI)
Reor✅(Electron)
NotebookLM✅(2025-09 起)

只有 Khoj 是 6/6 全覆盖。

3.3 模型自由(2026 越来越重要)

随时切 GPT / Claude / Gemini / 任意本地 Ollama 模型 —— 没有 vendor lock-in。Pricing 对比示例:把 vault QA 从 GPT-4o($2.5/1M token)切到 DeepSeek API(¥1/1M token,~$0.14)等,成本可降 95%+。

3.4 Automations(同类里独家)

把 Khoj 从”反应式”变”主动式”。例如每周一早上自动跑”上周的笔记摘要 + 本周 3 个重点”。这是 NotebookLM 完全没有的能力

3.5 Org-mode 一等公民

Emacs / Org-mode 用户在 AI 工具圈一直是二等公民(大部分工具不支持)。Khoj 把 org-mode 做为顶级文件类型,这个细节体现产品哲学的认真


4. 限制 / 缺点 / 已知问题(必读)

4.1 自托管设置复杂(最大痛点)

i-scoop.eu 评测和 HN 多个用户都提到:

  • Docker / Kubernetes 配置问题
  • macOS / Windows 安装问题(libGL.so.1 等)
  • Python 版本不兼容
  • 依赖冲突

实际含义:第一次装 Khoj 不是”5 分钟搞定”,要预留 1-3 小时。如果你之前没装过 Docker 或不熟悉 Python 环境,准备好查 issue 解决问题。

4.2 Telemetry 默认开启(隐私小坑)

HN #36642925 用户讨论:

“Telemetry is enabled by default and may contain API and chat queries”

虽然团队回应”build in the open is critical for trustworthy AI”,但默认开启 telemetry 这件事对隐私敏感用户是个意外记得首次启动后立即关掉(配置文件可关)。

4.3 配置必须改 YAML(UI 不够)

HN 用户建议:“配置应该在 UI 里,不应该 bake 进 container image”。当前 Khoj 高级配置仍需编辑 YAML / 环境变量。新手心理门槛高

4.4 推 push 节奏比同类略缓

项目上次 push距今
AnythingLLM2026-05-091 天
PrivateGPT2026-02-262.5 月
Khoj2026-03-261.5 月
Reor2025-05-1312 月 ⚠️

Khoj 仍在维护,但比 AnythingLLM “天天 push” 节奏明显缓。可能是团队转向 Pipali 新产品,或是稳定性维护期。

4.5 多用户 / 团队功能弱

i-scoop / blog.premai 评测都指出:

  • Khoj 优先个人生产力
  • 多用户 / 角色 / 访问控制 / 企业治理弱于 AnythingLLM

实际含义:个人或小团队(2-3 人)用 Khoj 没问题;5+ 人组织用 AnythingLLM 更省心。

4.6 与 Claude MCP / Cursor 的关系不清晰(战略问题)

GitHub issue #1006 用户提问:

“Can you explain what are khoj advantages over just using Claude MCP with its integration capabilities?”

随着 Claude / OpenAI 推 MCP / agent harness,Khoj 的”个人 AI 助手”定位面临挑战:为什么我不用 Claude Code + MCP 直接连我的笔记? Khoj 的 Pipali 是回答这个问题的尝试,但战略仍待时间检验。


5. 同类竞品横评

5.1 AnythingLLM(Mintplex-Labs,59,792★)

定位:“all-in-one AI app”,面向团队 + workspace优势:多用户 RBAC、workspace 文档管理、no-code agent builder、Scheduled Tasks(2026 新增,与 Khoj Automations 类似)、MCP Tools、embed widget。 劣势:不是”个人 AI 助手”路线 —— 它是”团队的 ChatGPT 替代”。手机端较弱。 官方:https://github.com/Mintplex-Labs/anything-llm 何时选它:你是 5+ 人小团队,要给所有人一个共享 ChatGPT 替代品。

5.2 PrivateGPT(zylon-ai,57,209★)

定位:100% 本地 + 文档 QA,无 agent / 无多用户 / 无 multi-platform优势:最纯粹的”chat with my docs locally”;配置好之后非常稳定。 劣势:没有手机端 / Obsidian 集成 / agent / automation。学习曲线偏陡,需要 Python 部署。 官方:https://github.com/zylon-ai/private-gpt 何时选它:你是开发者,只要”本地文档 QA”,不要任何花哨功能

5.3 Reor(reorproject,8,559★)

定位:Obsidian alternative + AI built-in(README:“Private & local AI personal knowledge management app for high entropy people”)。 优势:最直接的同类竞品 —— 类 Obsidian 编辑器 + 内置语义检索 + AI Chat。零配置,装上就用。 劣势:2025-05-13 后 12 个月未更新(GitHub API 直拉确认),社区小、生态弱、迁移到 Obsidian + Smart Connections 损失小。 官方:https://github.com/reorproject/reor 何时选它:几乎不建议 —— 维护停滞 12 月,Obsidian + Smart Connections + Copilot 已覆盖绝大多数场景。

5.4 NotebookLM(Google,云端)

定位:云端研究助手,Google 出品。 优势:质量极高(Gemini Pro 默认)、podcast 一键生成是杀手级、零配置、免费(暂)。 劣势:数据传 Google(ToS 允许训练)、模型只能 Gemini 系、不能自托管没有手机原生 app(2025-09 之后才有)。 官方:https://notebooklm.google.com 何时选它:你不在意数据隐私 + 想要 podcast 生成 + 想用 Gemini。对律师 / 医生 / 个人日记不推荐

5.5 横评决策矩阵

你的特点推荐
个人独立用户 + 隐私敏感 + 已用 ObsidianKhoj(配 Obsidian 插件) 或 Obsidian Copilot + 本地 LLM(详见第 22 篇)
个人独立用户 + 想要 6 端覆盖(尤其 WhatsApp / Emacs)Khoj
5+ 人小团队 + 想统一 chat 平台AnythingLLM
开发者 + 只要纯本地 QA + 不要花哨PrivateGPT
想立刻试一下 + 不在意数据传 Google + 想要 podcast 生成NotebookLM
Mac / Windows + 想要”开箱 AI 笔记”(零配置)Reor(谨慎,12 月没更新)或 Obsidian + Copilot

6. 你应该选 Khoj 吗(决策树)

你已经在用 Obsidian?
├─ Yes →
│   ├─ 想要 6 端覆盖(尤其手机 + WhatsApp 提问 vault)→ **装 Khoj 插件**(本地 + 移动端)
│   ├─ 已经装了 Copilot + Smart Connections,基本满足 → **不需要 Khoj**(第 22 篇方案够)
│   └─ 想要 automations(主动通知 / 周报)→ **Khoj 的 unique value**

├─ No(用 Logseq / 纯 markdown / 其他)→
│   ├─ 想要 self-host + 个人 AI → **Khoj 是最好的选择**
│   ├─ 想要团队共享 → **AnythingLLM**
│   └─ 只要 chat with docs → **PrivateGPT**(纯)或 **NotebookLM**(云,易上手)

对独立开发者的建议:

  • 如果你已经按第 22 / 第 23 篇装了 Obsidian Copilot + 本地 Ollama Qwen 3,绝大多数能力已覆盖
  • Khoj 的边际增量主要在 **③ 6 端覆盖(手机 / WhatsApp 在路上提问 vault)**和 ④ Automations(主动通知)
  • 建议:先用 cloud app.khoj.dev 免费版试 1 周,体验”6 端从手机问 vault”的感觉,如果有用,再考虑自托管;如果不实用,继续 Obsidian + Copilot 路线就好

7. 实操起步(轻量,主要指向官方文档)

# Option 1: Cloud(零配置,30 秒上手)
# 直接打开 https://app.khoj.dev,Google 账号登录,把笔记拖进去即可

# Option 2: Self-host(Mac 本地,1-3 小时)
# 1. 装 Docker Desktop
# 2. clone https://github.com/khoj-ai/khoj
# 3. 跟随 https://docs.khoj.dev/get-started/setup
# 4. 配置 Ollama 本地模型(详见第 23 篇:本地 LLM 工作流)
# 5. 装 Obsidian Khoj 插件指向 localhost

避坑要点:

  • 第一次启动马上关 telemetry(setup 文档第一步)
  • macOS 上如果遇到 libGL.so.1 错误,看 GitHub issues
  • 不要直接生产用 —— 先用云版熟悉功能再决定是否自托管

完整安装文档:https://docs.khoj.dev/get-started/setup


🟢 译者总评

3 个 takeaway:

  1. Khoj 在 self-host AI 第二大脑这个 niche 是”产品最完整”的方案 —— 不是 stars 第一(AnythingLLM 在),不是最纯粹本地(PrivateGPT 更纯),但唯一同时做到 ① 开源自托管 ② 6 端原生客户端 ③ AI 助手而非纯 RAG ④ agent + automation。这种”四个都做到”的产品,在小厂里极少见。

  2. 它的 4+ 年生命跨越 RAG 时代和 LLM 时代,基础设施扎实。Created 2021-08(GPT-3.5 都没出),熬过了 RAG 工具大爆炸期,2026 仍在维护并扩展(Pipali)。这种”穿过技术换代”的项目,通常比 2024 后冒出来的 RAG 工具更靠谱。

  3. 但 Khoj 的”个人 AI 助手”定位 2026 面临 Claude MCP / Cursor / Codex 的冲击。Khoj 自己用 Pipali 回应这个挑战,但战略胜负仍未定。对 Obsidian 用户而言,Copilot + 本地 Ollama 路线已经覆盖 70% Khoj 价值(详见第 22 篇),边际增量主要是 ③ 6 端覆盖 + ④ automations。

反共识结论:

  • 不要因为”34K stars”就盲装 Khoj。先评估你是否真的需要 6 端 + automations。如果不需要,Obsidian + Copilot + Smart Connections + Ollama(本系列 13 / 14 文)更轻
  • 不要直接自托管。先用 cloud app.khoj.dev 一周判断价值,自托管的 1-3 小时投入要在确认有价值之后
  • 不要忽略它最大的弱点 —— 团队/多用户场景弱。如果你有团队需求,AnythingLLM 更顺手;Khoj 是为个人写的

🔗 延伸阅读(本系列内)

🔗 调研来源(可校验,2026-05-10 自核)

官方资源:

深度评测(本文核心引用):

社区讨论(批评意见来源):

竞品官方仓(stars 自核 2026-05-10):

stack.lol 横评聚合(对比多个 ChatGPT 替代):


本文方法:所有 GitHub stars 自核于 2026-05-10(GitHub API 直拉,未使用任何 agent 二手转述)。批评意见保留 Hacker News 原帖链接以便后续追溯校验。版权:评论合理使用 + 显式署名 + 链接回原文。