我用Claude Skill解决了自己制作PPT的问题,也踩了不少坑
← 返回我的实践

我用Claude Skill解决了自己制作PPT的问题,也踩了不少坑

在前面的文章我提到,面对层出不穷的各类AI工具,很多"AI前沿者"都是拿来就用,不管有没有帮助,走在前沿最重要。

我也表达了自己的观点:我并不关心最新的技术是怎样的,我更关心它能帮我解决什么问题。 那么,这篇文章分享的Claude Skill是否违背了我的初衷?

我想并没有,一开始我也觉得这个Claude skill没啥用,但后面看了一下别人的使用案例,发现确实有点用处,不像之前有的工具那样拉垮……

什么是Claude Skill?

我们日常工作时,常会遇到一些重复性的任务,举个例子,每次出差后的报销流程就是如此,报销需要填写单据,而单据每次填写的格式都是固定的,不变的是字段,变的是起点、终点和价格等字段值。

它其实就是一套标准化的SOP流程。

那么这和Skill有什么关系呢?

Skill其实就是帮我们完成重复性的标准化工作的东西, 它既可以像工作流那样稳定运行,又具有AI灵活的优点。

填写报销发票时,如果用传统的工作流,可能只能针对高铁票进行识别,但如果下次我坐的是飞机或者给它的是非标准票据,它就不一定能准确识别了,但如果我用Skill,它就可以先让支持多模态的AI提取票据信息,然后自动给我填写表单。

学习Claude Skill踩到的坑

知道了什么是skill,我便开始学习,一学就踩坑了…

首先最重要的问题是,这东西到底怎么用?

我看了很多的攻略和教程,然后去安装这个Skill,注意"安装"这两个字,我误以为安装Skill就像安装软件一样,下载安装包,根据引导提示点击下一步一路安装,但实际上并非如此。

它反而更简单:下载完Skill的压缩文件后,直接解压,放到Claude文件目录里的Skill文件夹,这样就完事了…

这个文件夹里会包含Skill的说明文件(skill.md)、参考文件(references)以及脚本文件(scripts)。

最重要的是skill.md它的头部有name和说明,会告诉AI在什么场景下需要调用该skill

为什么要这样设计?

我们都知道,不管是什么大模型,它的上下文窗口都是有限的,假如我有10个Skill,如果每次对话都全部加载,那上下文空间直接就被skill给占满了,而我也不是所有任务都要用到skill,所以上下文空间就被大大浪费了,通过这两个字段,就可以让AI在需要时才调用,然后加载出skill的全部信息。

在Skill的文件夹里,还包含了脚本文件,skill能够像工作流那样稳定输出,就是靠这些脚本,它支持用Python或者其它编程语言,这是我踩的第一个大坑,我不明白安装skill其实就是复制个文件夹。

第一次使用Skill的体验

接下来,我碰到了第二个坑,我以为它是通过特殊暗号去调用(即"/"斜杠命令),但实际上并不是。 Claude Skill的调用非常简单,只要我们让AI完成的任务需要使用到skill,它就会自动调用。

当时我写了个前端项目,正好有个Skill可以优化前端页面,于是我告诉AI:“你帮我优化这个项目的前端页面。” 它就自动调用相关Skill帮我优化掉了。

所以,Skill使用起来很简单,其实就是告诉AI要干什么,或者指定调用哪个Skill,它就会自己去安排。

创建我的第一个Skill

在学会了怎么安装和使用之后,我就开始尝试创建Skill了。

恰好,我之前有个工作刚好完美符合skill的场景,平时我喜欢去博物馆参观,恰好最近在整理博物馆旅游攻略,需要为每个攻略做个PPT,它的流程是:

利用AI查阅博物馆相关资料 --> 校对AI搜集的信息 --> 利用AI整理成PPT

之前每一步都是拆开单独完成的,但现在我想试试Skill能不能完成这个工作,于是我告诉AI,帮我做个对应的skill,不一会儿它就搞完了,结果,它做出来的PPT完全不可用,排版非常混乱,乱七八糟的,也丑的很…

我想到Claude官方有个做PPT的Skill,我就让AI去参考它修改一下,AI告诉我,有两个路线:一个是把我原来的方案进行优化,直接用代码生成PPT,但是耗时久,排版有可能依旧很烂;第二个是参考官方的Skill,先做成HTML网页,再把HTML网页转成PPT。

我果断选了第二个路线, 因为写HTML代码是AI非常擅长的事情,而且PPT本质上也可以理解成是一页一页的HTML页面的截图,接下来,我就让AI帮我继续完善这个Skill。

然后我测试了一下,效果好的不要太多…虽然样式还有很大的优化空间,但比第一版效果好很多了,后续再迭代一下,就可以大大减轻我的工作量。

我认为对于Skill这个功能,我们也不一定要去找别人的来用,因为别人的使用场景不一定适合我们,所以可以自己创建个适合自己的。

这篇文章就是我探索Skill的过程,以及踩的坑,总结出来跟大家分享下,我理解Skill对应大部分来说,还是有使用门槛的,它的很多工作也许也能用诸如Manus这类的通用智能体替代,这会更简单,不过我还在持续探索中,目前的判断不一定对,供大家参考。