现在 Coding Agent 领域,最好的产品就是 Codex 和 Claude Code,但 Claude Code 对大多数人来说,使用门槛有点高,而且这个狗公司经常封号。
所以对于想入手 AI 编程的朋友来说,我推荐的 Vibe Coding 工具是 Codex。从去年 11 月开始,我就一直在高强度使用 Codex,上手简单,纯图形界面,界面还有中文,开箱即用。虽然它也有命令行版本了,但用起来不太友好。Codex 跑的是 GPT 5.5,还能调用 GPT Image 2 生图。
我找了网上很多教程,都没有非常详细和全面地讲解怎么从0开始使用 Codex。所以我花了一周时间,给大家写一份从零开始 Codex 编程的教程。面向的是那些想上手 AI 编程,但又不习惯用 Claude Code 这类工具的朋友,当然前提是要有一个 GPT Plus,需要自己解决下…
01 Codex 是什么?
先说下Codex桌面端和 Codex CLI 的区别。Codex CLI 是命令行版本,适合程序员这种习惯命令行的人。
像我们这类小白,最好还是用 Codex 的桌面端,性能是一样的,除了编程,它也能帮我们处理日常工作,跟 Claude的Cowork以及TRAE Solo的MTC模式是一样的。
如果你平时用的是 ChatGPT 或豆包这类聊天工具,那 Codex 就像真正能帮你干活的程序员——它能看你的项目文件、跑命令、改代码、自己测试,还能帮你改表格、处理发票数据、写文档,而且直接交付在你的本地电脑里。能力比豆包、ChatGPT 这类对话 AI 工具强非常多。
02 下载安装
直接访问官网下载安装就了。
官网地址:chatgpt.com/codex
Mac 和 Windows 都支持,只不过目前 Windows 版还不支持 Computer Use 功能。
下载完用 GPT Plus 账号登录就行了。
03 基础操作
首次进入,你会看到下面这样的页面。
我知道你迫不及待地想开始口喷需求让它写代码了。我知道你很急,但请先别急,先听我讲完下面这些基本操作,会让你的使用体验提升一个台阶。
3.1、工作区
项目模式和对话模式
左下角有个「进入项目工作」的选项,可以选择进入项目模式还是对话模式。
对话模式:类似网页端豆包或 GPT 的对话,处理简单临时的工作,比如整理个 Excel 表格。但如果要做完整的产品,就必须打开项目模式。
项目模式:项目就是文件夹。像我之前做公众号排版工具,所有代码都在对应的文件夹里,每次用 Codex 改代码的时候,就要打开对应的项目文件夹,否则Codex不知道你的代码库长啥样,干活也就无从谈起了。
这就好像我们给实习生交代任务,但不说前因后果,全靠它猜,那效果肯定不好。
权限设置
它有三个权限:默认权限、自动审查和完全访问。
默认权限:AI 每做一次操作都会请求你批准。比较保守,适合希望自己审核每一行代码的人。但效率影响比较大,我不太推荐,用起来很麻烦之极,隔几秒就要批准一次,会让人崩溃。
自动审查(推荐):每次 AI 执行操作,都会有另一个 AI 来审核它的操作,看有没有风险。相当于我们雇了个 AI监工,帮我们监督AI干活,既兼顾效率,又保证了安全,我推荐首选这个模式。
完全访问权限:相当于让AI放飞自我,没有了人审批,也没有AI监工,直接原地起飞。所以千万不要轻易开启,即使是老手都可能出问题。前段时间海外有个用Cursor 写代码的哥们,AI把它项目文件清空了,导致线上数据直接没了。
选择模型
右边可以选择模型,推荐用最新的 GPT 5.5,性能强,速度快,说话风格也不像之前那样啰嗦。推理程度可以根据需要选择,我一般默认用「高」,能解决大部分问题。
左侧面板:项目、Thread 等区域
项目:前面提到了,这里不展开了。
Thread(任务对话):这个是任务对话的意思,比如我想在Skill演示的这个项目里面,让AI画出流程图,就可以创建对应的任务对话。它有点像便签纸,最好每张只做一件事,不然容易导致上下文污染。
注意:对话开太多的时候,可以让 AI 总结当前任务,然后新开一个对话继续,不然上下文太长 AI 会出现幻觉。
一个简单的原则:同一个工作区只做一个项目;同一个 Thread 只处理一件事;临时简单的任务用对话模式。
自动化
左边那张图是我自己配的两个自动化任务:第一个是定期扫描排版工具的 bug,每天帮我扫最近改的代码有没有问题;第二个是帮我评估每天的会话有什么可以做成自动化的。
要新建自动化,就可以点右上角的「新建自动化」。进去后填写描述、添加提示词(比如让它扫描 bug),左下角选运行环境(一般选本地),再选择对应的项目,右边设置时间。Codex 还内置了很多自动化模板,比如扫描 bug、总结昨天的 Git 活动,点开模板直接用就行。
右侧面板:文件、项目目录、diff 面板、浏览器
右侧面板有三个入口:终端(一般用不上);文件预览(查看项目所有文件,跟电脑资源管理器一样);侧边栏(审查代码修改、打开文档/HTML 页面,相当于一个内置浏览器)。
3.2、设置
个性化
这个页面非常重要。首先可以模型的说话个性,建议默认选「亲和」,这样回答起来不会那么多专业术语。
第二块是自定义指令,这个非常重要——它是给 AI 的根本大法,AI 干所有的活都要遵循这个规定。在 Claude Code 里对应的是 Claude.md,在 Codex 对应的就是 Agent.md。
我给大家准备了个参考模板,取众多大佬的配置之长,又结合了我们这种小白的实际场景,可以参考参考。
关注并回复 “Codex教程” 即可获得全文文档~
MCP 服务器、Skill、插件
这三个非常容易弄混,所以放在一起讲。
MCP:设置入口在设置里面。MCP 让 AI 有调用外部工具的能力。比如接入飞书的 MCP,它就能读取你的飞书文档;接入高德地图的 MCP,就能帮你做旅游规划、路线图。没接入的话,AI 就没有这个能力。
Skill:Skill 的入口在左侧面板的插件里。Codex 的亮点是它有可视化界面来管理 Skill,可以看到系统推荐的 Skill 和本地安装的 Skill。Skill 一套干活的SOP,MCP是具体的工具。
插件:插件相当于一个工具包,可能包含多个 MCP、Skill、脚本等。比如表格插件,就配了个 Skill 来快速生成符合要求的表格。打个比方,我们买了一台相机,会有镜头、灯、修图预设这些配套的套件,他们就是插件。
浏览器使用
这个插件可以让 AI 可以打开浏览器、自己访问内容。
很多时候我们让 AI 改页面 UI,用文字描述「哪个按钮往上一点」,它可能搞不懂在哪,但通过浏览器,我们可以在对应位置圈选加批注,Codex 就知道你要改哪个位置了。
还有一个很重要的作用:AI 写完项目后需要做闭环测试,它可以自己调用浏览器去看页面、调试,省去我们一个个截图告诉它改哪里的时间。
04 实战
上面这些基础概念,你可能看完觉得懂了,但一操作还是不太明白。所以我选了一个简单项目来演练——花不到 10 分钟,让 AI 帮我们做一个 3D 星空穿越特效网页。
为什么选这个项目
因为一个 HTML 文件就能跑,不需要额外装什么东西;打开页面后视觉冲击感很强,正反馈拉满;而且它涉及 3D 投影、粒子系统、鼠标交互,不是 AI 随便搞搞就能搞定的。
开 Plan 模式,先规划
首先建好一个工作区文件夹,比如叫 Star Warp,打开后 Codex 产生的代码和文件都会在这个文件夹里。
接下来开一个任务对话(也就是前面说的 Thread),打开对话后,点左下角把计划模式的开关打开。这样 AI 会先帮我们出方案,确认后再干活,稳如老狗,我极力推荐大家这么做。
权限选自动审查,然后我们就可以在对话框用文字描述需求。
我用的提示词是这样的:
帮我做一个 3D 星空穿越效果,用纯 HTML + Canvas 实现。星星从远处飞来加速掠过屏幕,有拖尾效果,鼠标控制方向,滚轮控制速度,星星颜色随速度变化,背景有星云雾气,要流畅跑 500+ 星星 60 fps。
AI 会帮你出一个方案,我们可以看看计划有没有问题,主要看业务逻辑是否符合要求。符合就直接点「实施计划」;不符合的话还能改。
等它干活
AI 开始帮我们创建文件、写代码,所有文件都在刚才建的 Star Warp 文件夹里。
大概 2-3 分钟就写完了。在右侧浏览器里让 Codex 打开页面看效果。比如我觉得左上角的交互太丑了,就在浏览器里点批注,框选要修改的位置让它改。
用嘴改需求
改完交互还觉得不够好?继续口喷需求就行:觉得星星太少,把数量加到 2000;还可以换个颜色,星星全部改成赛博朋克风格的霓虹色;还可以加个按空格键截图保存的功能。
最后效果非常酷炫,一个 3D 星空穿越特效就做好了。
全程我们只是用文字口喷需求,一行代码都没写,我也看不懂代码是什么,这就是 Vibe Coding——一行代码都没写,但这个东西是我们做出来的,就非常的爽。
05 去玩,别去学
这个 Codex 教程到这里就写完了。基本的操作、怎么做项目,都带着大家捋了一遍,建议大家自己去尝试,很快就能上手。
千万不要被「编程」这个词吓到,我自己也不懂代码,全靠AI帮我做出来了很多产品,我们只需要知道干什么就行,中间的脏活累活丢给 AI 就好。
我们也大可不必说「学」AI 编程,而应该是「玩」,抱着学的心态,你会觉得这东西很难;抱着玩的心态,你会发现它就是一个玩具,一点都不难。
在 AI 时代,创造力才是最稀缺的东西,而你已经有了,尽情去玩吧。