模型即Agent,Kimi的新尝试
← 返回产品测评

模型即Agent,Kimi的新尝试

前段时间,Kimi 推出了一个叫 OK Computer 的模式,这种模式的特点在于可以通过更多轮次的推理和工具调用,消耗更多的 token,从而带来更高的智能水平。

Kimi 几个月前发布 K2 模型时,他们就提出过一个概念叫模型即Agent。现在大部分的Agent,其实本质上就是在模型的基础上增加了记忆和工具调用,那么,如果让模型本身也学会调用这些工具,是不是也能直接进化成一个Agent呢?

我觉得他们这个路线是完全可行的。

OK Computer 就是在这条路线上的一次尝试,它基于端到端的强化学习技术,将 Kimi K2 模型训练成一个原生的 agent。这样,模型能够熟练使用包括文件系统、浏览器、终端、代码、图像生成等二十多种工具,它可以自主构建完成复杂任务所需的内在知识,不需要再用一个基座模型反复微调来搭建 agent,而是让模型一开始就是个原生的 agent。

OK Computer 这个模式,其实就像是拥有一个虚拟电脑,可以连续工作十几甚至几十分钟,能够完成网站设计、移动端友好的外部应用开发,以及设计 PPT 等任务。

在国产大模型团队里,Kimi 和 DeepSeek 是我比较看好的两家,能够持续做出让人眼前一亮的创新。Kimi在今年 DeepSeek 发布之后,曾沉寂了一段时间,直到前两个月,发布了 Kimi 的 K2 模型,又重新回到了前列,这个团队真的非常有韧性。

目前,免费用户可以有三次免费使用机会,我猜这可能是因为成本比较高,所以做了限制。

我测试了 OK Computer 这个模式,刚好最近我想参观故宫的百年展,但对很多文物不是很了解,于是让它帮我整理了故宫百年展的 31 个重点文物,并为这些重点文物写了一份特展介绍的 PPT。

Kimi 迅速开始工作,首先列出Todo,随后收集各种素材,最终创建了一个PPT。

可以看到下面的图片,它制作的 PPT审美非常在线,整体效果非常漂亮,可以说你完全想不到这是由 AI 完成的,它收集的图片大部分来自网络,总体正确率还是挺高的。

我之前也用过其他生成 PPT 的工具,比如genspark,但它们的审美和效果远不及 Kimi。我的朋友还使用 Kimi 的 OK Computer 直接生成了一个简单的移动端应用。由此可见,OK Computer 的能力确实非常强大。

我感觉以后随着不断迭代,它甚至可以 24 小时不间断工作,帮助我们完成更多任务。未来,我们可能可以直接用OK Computer口喷创建有着完整前后端功能的移动端应用,它能够自动检查 bug 并部署上线,除了开头要我告诉它需求,后续完全不用自己管,我觉得是有可能实现的。