最近在推特上,卡帕西的一条推文又火了。
我还刷到条挺有意思的推文,他说卡帕西绝对是 AI 界的焦虑之王。仔细想想还是有点道理的——每次卡帕西只要一出什么新概念,推特上的讨论热度就直接拉满哈哈。
这次他提出了 LLM-Wiki 的概念,我理解就是个知识管理工具,把 AI 融入到知识管理中,也是我一直在探索的方向。
什么是LLM-Wiki
LLM-Wiki 的架构分为三层:
第一层是 原始资料库
你所有收藏的文章、论文、笔记,全部堆在这里。AI 只能读它,不能修改,这是所有文档的源头,有点像我每日复盘工作流,利用了备忘录保留原始记录。
第二层是 维基库
AI 会从原始资料里提炼,整理成对应的Markdown 文件,同时它会维护一个索引文档,建立文档之间的联系。
这是为了解决什么问题呢?
之前像ima这种rag知识库,每次对话都是从 0 到 1 去检索,AI完全不知道各个内容之间有什么关系,也不知道历史的上下文,通过维基库这种机制,知识就被关联起来了。
第三层是 规则库
定义了 AI 应该怎么处理事情、哪些不能做、边界在哪里。
整体运行流程就是:你在浏览器里看到好文章,一键剪藏到原始资料库,AI 自动去读、去整理、去更新维基库,苦活累活都是AI干,你只需要跟 AI 对话和思考,有新的沉淀就会被写回维基库,它还会定期巡检知识库。
之前在我的每日复盘工作流里,也建了一个索引文件,把过去6年的复盘全部在一个索引文件里面,包括其它的素材库,也是这样处理,借鉴了渐进式加载的思路,只不过卡帕西扩大到了整个知识管理。
不过,不同的是他还引入了一个本地的 RAG 引擎,当数据库特别大的时候,就可以利用在本地做混合语义搜索,我把他用的这个项目链接也放在这里:https://github.com/tobi/qmd
不过,讲真,对大部分人来说,这玩意不一定用得上,我们的个人知识库,大概率是不会超过 100 万 token,当前主流的AI模型上下文一般都能吃得下,用索引加渐进式加载去处理,完全应付得了。
像 Claude Code 也没有完全依赖 RAG 引擎,而是用了 grep 这类命令行工具去搜索关键词,反而更精准。所以只有当知识库膨胀到非常大的时候,这类本地RAG 才有用武之地。
对我们有什么启发?
他的这套工作流,对我来说,有个值得借鉴的地方,在于他用了 Obsidian Web Clipper 这个浏览器插件去做剪藏,一键就能把看到的好文章收进自己的仓库,这还挺方便的,因为有时候我也会收藏许多不错的文章,留着以后查阅。
但是,他的这个思路,有个让我觉得值得商榷的地方。
当我们把所有文档都交给 AI 去输入和输出,自己只是通过提问和它对话——看起来好像在做思考、在做提问。
但你要知道,AI 有时候是挺过度谄媚的,而且它会把人带到沟里去。你去提问,很难保证自己不被它引导着走,除非你有非常强的独立判断能力。
之前我也写过一篇文章专门聊过这个——我们得分清楚,哪些事情是应该"外包"给 AI 的,哪些事情是不能让 AI 替我们做的。知识的整理可以外包,但思考本身不行。
维基库的文档全部都是 AI 整理的,我们人在里面的参与感其实非常弱。美其名曰是你和 AI 共创的,但实际上 80% 的内容都是 AI 在做。对我们自己的成长来说,可能反而有害,这是放弃了自己的主体性。
这件事情的边界,需要我们持续探索,目前我也没有一个好的答案。与其跟着卡帕西的节奏焦虑,不如先想清楚自己想要什么。