卡帕西又提出了个新概念,对我们有什么启发?
← 返回AI观察

卡帕西又提出了个新概念,对我们有什么启发?

最近在推特上,卡帕西的一条推文又火了。

我还刷到条挺有意思的推文,他说卡帕西绝对是 AI 界的焦虑之王。仔细想想还是有点道理的——每次卡帕西只要一出什么新概念,推特上的讨论热度就直接拉满哈哈。

这次他提出了 LLM-Wiki 的概念,我理解就是个知识管理工具,把 AI 融入到知识管理中,也是我一直在探索的方向。

什么是LLM-Wiki

LLM-Wiki 的架构分为三层:

第一层是 原始资料库

你所有收藏的文章、论文、笔记,全部堆在这里。AI 只能读它,不能修改,这是所有文档的源头,有点像我每日复盘工作流,利用了备忘录保留原始记录。

第二层是 维基库

AI 会从原始资料里提炼,整理成对应的Markdown 文件,同时它会维护一个索引文档,建立文档之间的联系。

这是为了解决什么问题呢?

之前像ima这种rag知识库,每次对话都是从 0 到 1 去检索,AI完全不知道各个内容之间有什么关系,也不知道历史的上下文,通过维基库这种机制,知识就被关联起来了。

第三层是 规则库

定义了 AI 应该怎么处理事情、哪些不能做、边界在哪里。

整体运行流程就是:你在浏览器里看到好文章,一键剪藏到原始资料库,AI 自动去读、去整理、去更新维基库,苦活累活都是AI干,你只需要跟 AI 对话和思考,有新的沉淀就会被写回维基库,它还会定期巡检知识库。

之前在我的每日复盘工作流里,也建了一个索引文件,把过去6年的复盘全部在一个索引文件里面,包括其它的素材库,也是这样处理,借鉴了渐进式加载的思路,只不过卡帕西扩大到了整个知识管理。

不过,不同的是他还引入了一个本地的 RAG 引擎,当数据库特别大的时候,就可以利用在本地做混合语义搜索,我把他用的这个项目链接也放在这里:https://github.com/tobi/qmd

不过,讲真,对大部分人来说,这玩意不一定用得上,我们的个人知识库,大概率是不会超过 100 万 token,当前主流的AI模型上下文一般都能吃得下,用索引加渐进式加载去处理,完全应付得了。

像 Claude Code 也没有完全依赖 RAG 引擎,而是用了 grep 这类命令行工具去搜索关键词,反而更精准。所以只有当知识库膨胀到非常大的时候,这类本地RAG 才有用武之地。

对我们有什么启发?

他的这套工作流,对我来说,有个值得借鉴的地方,在于他用了 Obsidian Web Clipper 这个浏览器插件去做剪藏,一键就能把看到的好文章收进自己的仓库,这还挺方便的,因为有时候我也会收藏许多不错的文章,留着以后查阅。

但是,他的这个思路,有个让我觉得值得商榷的地方。

当我们把所有文档都交给 AI 去输入和输出,自己只是通过提问和它对话——看起来好像在做思考、在做提问。

但你要知道,AI 有时候是挺过度谄媚的,而且它会把人带到沟里去。你去提问,很难保证自己不被它引导着走,除非你有非常强的独立判断能力。

之前我也写过一篇文章专门聊过这个——我们得分清楚,哪些事情是应该"外包"给 AI 的,哪些事情是不能让 AI 替我们做的。知识的整理可以外包,但思考本身不行。

维基库的文档全部都是 AI 整理的,我们人在里面的参与感其实非常弱。美其名曰是你和 AI 共创的,但实际上 80% 的内容都是 AI 在做。对我们自己的成长来说,可能反而有害,这是放弃了自己的主体性。

这件事情的边界,需要我们持续探索,目前我也没有一个好的答案。与其跟着卡帕西的节奏焦虑,不如先想清楚自己想要什么。