我用开源项目让AI做了个工具,结果差点把磁盘干废了
← 返回我的实践

我用开源项目让AI做了个工具,结果差点把磁盘干废了

之前看到有人用一些软件导出聊天记录,做成日报之类的东西,我也用了一段时间。但前段时间,我突然发现电脑经常用着用着就卡住了。

我就打开任务管理器观察了好几天,发现这玩意的磁盘读写量异常离谱,别的程序基本不到 1 MB/S,它动不动就是100+ MB/S,虽然我也不懂这个数据多少是正常的,但和其它软件比,它的读写量差异过于明显,越想越不对劲,于是我下载了磁盘检测工具一看,给我吓一跳。

磁盘的健康状态不到半年就已经消耗了30%,这个速度非常恐怖,算下来,我每天大概要写入一个多 TB 的数据,而我的磁盘总共才 1TB,我问了问AI,正常的话,磁盘每天写入量大概是 100GB 左右,一个普通磁盘寿命大概是 600TB 的写入量,按照这个速度,再过几个月,我的磁盘就要废了,幸好及时发现…

后来排查了一下,原来是先把聊天记录的数据库解密后,复制一份到它的工作目录里,它有个自动增量解密的开关,我一直开着,而问题恰好出来这里,它这个"增量解密"其实是假的,并不是我理解那种只解密新增的聊天记录,而是它依然会每次复制一份全量的聊天记录,然后解密出来。

它这个增量,指的是解析页面看到的聊天记录是"增量",比如我们的聊天记录有5条,此时新增了1条,它会把过去的5条和新增的1条聊天记录数据都复制一份到工作目录,展示的时候,我们看到的是6条,所以看起来是"增量解密"了,你想想,即使每个聊天记录的也许就2 GB,但每隔几秒就重新写入一次,那一天1 TB多是轻轻松松能达到的…

这给了我一个非常大的教训,在用别人的开源项目,用 AI 做二次开发的时候,我们一定要注意对本机硬件的潜在风险,有的开源项目其实做得并不完善,存在非常大的缺陷。如果要长期运行的话,最好先用 AI 对它进行一轮审查,包括安全方面的审核,这一点非常重要。

后来我把这个项目关掉了,又用 Codex 写了一个磁盘监控脚本,从 5 月 17 号到 5 月 20 号,每天的真实写入量就降低了非常多,这才把我的磁盘保住了。如果再发现晚一点,这个磁盘就真废了,何况现在磁盘价格特别贵…我记得 23 年买了一个 2TB 的硬盘才 500 块钱,现在已经接近 2000 了,涨得非常离谱。

有了 AI 之后,我们总觉得自己什么都能干,但往往这时候就容易埋下安全隐患,这次给了我深刻的教训,即使是star数很多的开源项目,用之前也可以先让 AI 做个简单的审查再用,不然用着用着就踩坑了,代价可不小…要是有什么投毒的,就更麻烦了