我给社群请了个"AI矿工",自动挖掘聊天记录里的金矿
在之前的文章,我分享了如何做群聊播客以及群聊日报,帮助大家及时查收群聊干货,缓解信息焦虑。但对于一个高质量的社群,每日都会产生许多有用的干货内容,群里的聊天记录其实是一座待开发的金矿,仅仅依靠群聊播客和日报,是无法很好利用这座金矿的。
一是不管看日报还是听播客,对于历史的干货检索效率很低。
二是许多同一主题的干货,会分散在多天的聊天记录中,信息比较割裂,很难聚合在一起。
比如我想了解如何读书,这是个比较大的主题,涵盖了读书习惯养成、读书方法、读书工具等多方面内容,但在群聊的场景下,一般不会为它开个专场讨论,所以有关读书主题的讨论,会散落在多天的聊天记录中,必须聚合起来才能很好的利用。
于是,我想到了构建群聊干货的AI知识库,当我检索内容的时候,AI就像一个勤勤恳恳的矿工,按照我们的要求去知识库"挖矿",然后把挖出来带有"杂质"的金子,进一步提纯汇总。
那么,如何构建这样的知识库呢?话不多说,下面开始我们的教程~
一、主要流程
1、使用Chatlog导出聊天记录,并存为TXT文件
2、上传聊天记录到Gemini,让它根据我们的要求总结群聊干货
3、上传总结的群聊干货到ima知识库
二、主要步骤
1、导出聊天记录
这一步直接参考下面这篇文章的前两步
2、上传聊天记录到Gemini,总结群聊干货
许多群的聊天记录每日有四五千条,一个月下来就是15万条,数据量非常大,并且有许多无效信息。面对如此庞大的数据量,如果直接导入知识库,是很难准确识别出群聊干货内容的。
所以这里必须用Gemini来先对群聊记录进行初步总结,去粗取精,Gemini的上下文容量有100万token,能从容的处理这样的任务。
这里有3个关键点:
a、使用markdown语言:我们都知道,人与人之间的沟通需要依靠语言,那么人和大模型之间沟通也需要选择合适的语言,这里推荐使用markdown语言来保存干货,不管是人还是AI,都好理解;
b、让AI写填空题:对于知识库来说,上传的内容最好都是高度结构化的,这样AI易于理解,我们可以简单粗暴的把群聊干货划分为热议话题、资源分享、干货问答三大模块。
如果想要让AI每次都生成这种固定结构的内容,就必须对AI输出的内容结构做约束,让它写填空题,而不是开放性的问答题;
c、匿名化处理:群聊干货总结的时候,必须匿名化处理,保护大家的隐私安全。
可以看到,在我的提示词中,【输出结构与模块模板】约束了输出内容的结构,【模块填充规则】可以引导AI来填充内容,这样AI就能稳定生成固定格式的群聊干货总结。
此外,AI在内部总结理解的时候,可以提取群成员昵称用于内部理解上下文和逻辑链条,但输出结果的时候,必须匿名化处理。
3、上传群聊干货到ima知识库
这一步比较简单,直接在ima创建知识库,然后上传干货内容就行了,注意干货内容要用markdown格式。(如不了解可以问问AI怎么做)
这里提一下,为什么选择ima知识库?
现在知识库产品有很多,但不管是飞书、Get笔记等等,对于大多数群成员来说,都需要重新注册账号使用,不是很方便。
ima可以直接用微信账号登录,这样就和群成员的微信号关联起来了,不仅方便大家登录使用,也方便我们后续进行审核及后续管理。
三、结果展示
到这里,我们的群聊知识库就搭建完成了!
我用前面提到的读书话题来演示,我在对话框输入"如何读书?"后,AI就会先去群聊知识库查询干货内容,然后系统性的为我们进行总结。
从总结的结果我们可以看到,涵盖了批判性阅读方法、克服读书障碍、再到高效阅读及知识管理,一目了然,过去的干货"活了起来"~
其实群聊知识库说白了,就是让"AI矿工"去"群聊干货"金矿挖金子,然后再把金子进行提纯的工具。
在AI技术快速发展的今天,我们需要学会将AI融入到日常的工作生活中,利用先进生产力来提升我们的生产效率。
群聊知识库、日报、播客这套组合拳,不管是我们自己运营兴趣社群,还是专业做社群运营,都会很有帮助。