微信扫码
添加专属顾问
我要投稿
想快速掌握Codex,成为AI编程高手?这篇40分钟教程让你从安装到实战,轻松玩转10个实用场景!核心内容:1. 基础入门:Codex与Claude Code的区别及安装指南2. 功能详解:从基础操作到高级功能的全方位讲解3. 实战应用:10个到手即用的场景案例与配套资源
为了让每个小白都能从 0 掌握 Codex!我花了十几天,做了上面这期40分钟的视频。
🎬视频里知识点最全、操作最完整~我会从安装开始,手把手把 Codex 的基础能力到高级功能组合,用 10 个实战场景带大家彻底拉通~
看完,你不仅摸透 Codex 的能力,还收获 10 个到手就能用的实战用法。以后这类 Agent 产品出一个算一个,你都会触类旁通、游刃有余。
想全面掌握 Codex,强烈推荐先看视频!
📎 配套文档:视频里提到的命令、工具、skill、prompt 全都打包好了!跟着视频操作的时候随用随查👇
https://my.feishu.cn/wiki/OCY5wzbGhiLDr8kMulkcLLuSnQd
📖 图文教程:没时间看视频也没关系,你正在读的这一篇就是图文教程~读完知道 Codex 整体能干什么、自己该从哪一关入手,适合先建立全局认知,或者看完视频回来查漏~
好啦,话不多说,上课!
1.1 Claude Code跟Codex的区别
本质上他俩都是从编程 Agent 起家、逐步走向通用 Agent 的产品,分别是 Anthropic 和 OpenAI 出的。
模型、易用性、功能和价格上可以看看下面这张图~
功能上,Claude Code 原本是最齐全的,Skill、MCP、斜杠命令、Hook、远程操控这些都是 Claude Code 先发明的。
但Codex 这边后来居上,发了浏览器操控、Computer Use、image2 生图,还有手机端和 Hook——可以直接用手机 ChatGPT 控制电脑上的 Codex 干活。
在使用场景上,我日常办公用 Codex,写作用 Claude Code 搭配 Claude(Opus 4.6 的写作和规划真的很强)。编程的时候嘛,两个都用上。
结论是,入门的朋友 Codex 就很强,有条件的朋友 2 个都来很完美。2 者逻辑是一样的,学一个另一个就会用了。
Claude Code 我也做过一期系统教程,想拥有左膀右臂的朋友可以去看看~
全网最全!60分钟全面掌握Claude Code~【附完整文档】
1.2 基础上手
ok,正式开始,用 Codex 唯一要准备的,就是一个 ChatGPT 账号,免费的也行,只是额度少点。
有了账号,直接官网下载安装就好。
https://chatgpt.com/zh-Hans-CN/codex/get-started/
这里也随便选点,比如日常工作,反正后续可以改。
1.3 界面介绍
进来之后会看到一个对话窗口,跟 ChatGPT 很类似。
打开两边的侧边栏也蛮眼熟的:左边管理对话和任务列表,中间是聊天,右边大概是结果之类的吧。
大家都能猜个7788,所以我们先不深究,直接开用!
这其实也是我探索所有新 AI 工具的独门秘方:打开一个陌生界面,先不管别的,找到对话框先聊,找到看得懂的按钮先按,按着按着就会了。
第一个要了解的能力是本地文件操作,Codex 可以自主读取和操作你本地的文件,而且不限数量。
比如说,我作为剪辑,本地文件夹里存了 80 多条视频素材,命名全是看不懂的。我想用它们的内容来重命名,看见文件名就知道是什么素材。这事 ChatGPT 肯定做不了,Codex 可以。
2.1 项目文件夹
那我们来到这两个地方,可以看到都显示了一个概念叫项目。
我们一点"进入项目工作"就让我们选本地的文件夹了。
只要选中这个文件夹,里面的所有文件 Codex 都可以读取和操作。
当然,这需要我们给它权限。
2.2 三种权限模式
大家看这里的权限选择,目前我们是默认的权限,我们点开有三种权限模式。
那大家尤其是新手朋友,就选择自动审查模式相信AI就完了。咱又能审得比他好吗?对吧。
2.3 实战
ok,那我们选中刚刚的视频文件夹,继续来提出我们的需求。
帮我把这个文件夹里的所有视频素材,都按他们的实际内容重新命名
它做的时候非常聪明,先看到底有多少,然后选择抽取关键画面来判断内容,
而且它还知道不一个个看,拼成缩略图一组一组看,很快~
文件名全改变了,过程中没问要提权,因为都是在这个文件夹内操作。
我也分别对应了下,都是对的~而且它还遵循着序号、人物、场景、行动的清晰命名格式。
2.4 一个项目下可以同时开几个对话
我们也还可以在同一个项目里,开多个不同的对话,
比如在另一个对话里布置不同的任务,让它把所有关于风景的剪成一整条。它真能剪,用了一些工具,用 ffmpeg 拼在了一起。
2.5 创建新项目
那创建新的项目,我们可以手动在这边新建,
它会自动在本地同步创建一个文件夹。然后跟 Codex 对话的过程中,Agent 产生的任何文件,pdf、markdown、ppt 啊,也都会存在我们本地电脑上。
2.6 小总结
OK,大家应该get了!
Codex 可以随时访问本地文件,读取、写、删、移动文件。文件夹内的内容也就成了 Agent 随时可以获取的上下文。这里的"项目"也就对应着本地的一个文件夹。
3.1 上下文管理
那问题来了,刚刚这么个任务,会花我们多少额度呢?
界面上的这个小圈就能看到,它代表当前操作和对话使用了多少模型的上下文窗口。
当上下文快满的时候,Codex 会自动帮我们压缩。
其实当一个任务告一段落,不用等它自己动手,自己通过 /压缩 也可以手动压缩。能让模型更聚焦在新任务上,也省点上下文额度~
3.2 额度状态
除了对话的上下文余量,我们还想知道作为免费用户、Pro 会员、Plus 会员还有多少总额度对吧?
有 2 种方式:
第一种:左边设置中点开剩余额度,就能看到你 5 小时内还剩多少、本周还剩多少比例,甚至有什么时候到期刷新的提示。这个产品设计还是比 Claude 友好的。
第二种:直接在对话框里输入斜杠,找到"状态",
打开之后会在这个对话中持续显示上下文余量、5 小时限额和一周限额。
Codex 的额度还是非常大方的~20 刀我认为能满足大多数白领工作的高频使用。
3.3 模型选择
顺便我们也介绍这里的模型选择。速度这里,快速相当于加急通道,会消耗更多的额度。
模型这里可以选更多模型,不过一般还是最新就完事了~
然后上面也可以选择智能程度,一般中度智能就够了,我们也可以选高~
这个小麦克就是语音输入功能了。但转录速度远不如下载语音输入法,当然比手打字还是快很多,推荐用语音~
Codex的第二大能力,就是在我们授权的情况下,可以使用终端执行命令。
那我们就让 Codex 装一些平时对小白来说复杂的东西吧。
4.1 装环境
4.1.1 常用依赖:以后用啥都得有它们
大家以后用各种 Agent、做项目必备的工具,比如 nodejs、git 什么的。
我们可以一句话跟 Codex 说:"帮我安装nodejs最新版本",
因为这些东西比较常见,所以在自动审核权限模式下,你看它都不向我们申请提权,就熟门熟路帮我装好了。
4.1.2 爆火新 Agent
像龙虾,Hermes,甚至它的竞品Claude Code,都可以让Codex装,完了还能教你怎么用。
比如我们装个hermes吧,我都不需要给它hermes的官网和仓库地址,我就说最近有个叫hermes的Agent很火,你帮我安装一个吧。
它会自己搜索然后判断到底是哪个,然后根据官方的文档,帮我们装好了,还验证好了。
你瞧瞧,我们照着他说的启动下试试,真好了~
那往后的配置我们就不继续了,但大家应该get了,
有了Codex,以后那些复杂的部署都可以直接让他做。怒省599! 而且你在使用过程中遇到任何问题,还可以截图问Codex,什么虾死了,马挂了,升级出了问题,都可以让Codex直接帮你修。
4.1.3 软件应用:连卸载也能干
像 Cursor、Antigravity 这种软件应用,平时都是我们手动网页下载的,他也可以帮你下载和卸载。
用 Codex 我也建议大家下载一个 Agent IDE。因为现在 Codex 的缺点是没法打开文件内容直接编辑,侧边栏虽然可以看到文件结构和内容,但没法编辑。
所以大家可以让 Codex 下载个自己喜欢的当成编辑器。下好之后呢,右上角就会出现一个按钮,随时可以把项目在编辑器中打开。
4.1.4 Skills、MCP、CLI:找到链接发过去
Skill 和 MCP呢,Codex 本身也支持,我们后面会详细讲到。
这些 Skills 和 CLI 通常不像那些大项目那么著名,所以最好找到它的仓库或者明确的官方地址。比如下载一个专门找 Skill 的 find-skill,方式就是把链接拷贝给 Codex,说"帮我装下这个 Skill"。
4.2 并行任务处理
那刚才它在装skill的过程,我们可以再开一个对话,或者在项目中开一个对话。
比如一句话装个飞书 CLI。飞书 CLI 其实非常典型,现在有一些积极 AI 化的软件,把几乎所有原本能做的操作都做成 CLI 让 Agent 方便操作。
这边会显示每个任务的情况:转圈说明正在执行,蓝色点说明已完成,有时候还会出现需要你申请权限。
做完以后 Codex 就能帮我做飞书里的操作了,比如写文档、发消息、建日历、做表格什么的。我几乎每天都在用。
好,大功告成。我们就这么一个小章节,就用自然语言的方式让 Codex 帮我装好了 Hermes、node、git、feishu-cli 一大堆东西。这就是 Codex 作为 Agent 的第二大常用能力:命令行使用。
也希望大家能 get 到一点:我们在电脑上想做的很多事,都可以让 Codex 这样的桌面 Agent 去做~
那Codex的第三大能力,是持久记忆,它有这两套持久记忆系统。
在 Codex 里,手动的持久记忆文件叫 agents.md,自动的记忆机制也有。
5.1 全局 agents.md
打开设置找到个性化,这里的自定义指令实际上就是全局生效的 agents.md。
它会在我们任意项目跟 Codex 对话的时候,第一时间作为上下文发给大模型。
可以手动自己写,也可以直接在对话里跟 Codex 强调"记住这个事",让它自己写到这里去。
这是全局的长期记忆,适合记一些适用于所有任务的大原则,比如你的习惯、要说中文、工作偏好、修改文档要留下修订痕迹等等。
5.2 项目级 agents.md
另一种就是项目级的 agents.md,只在项目中生效。
比如我们选中了一个项目,可以打开右上角的编辑器自己创建 agents.md 手写针对项目的规则,也可以直接让 Codex 来写。
我的建议是在项目文件夹有内容之后,让 Codex 根据它对项目的了解,自己帮我们写。
5.3 自动记忆:实验性功能
自动记忆刚刚在个性化下面也看到了,需要手动打开。
它备注了这个功能是实验性的。机制是打开功能之后,Codex 会在我们结束对话、结束任务、闲置一段时间之后,帮我们把那段对话总结成记忆,记在一个地方。
不过有几个限制:
太短的对话它就不记了
记忆的总结一样会消耗你的额度,所以额度太低时它也不记了
自动记忆文件,OpenAI 官方不建议手动修改,顶多删一删没必要的信息
它大概长这样,是一个任务一个任务记录的。会写上记忆来源是哪段对话、工作目录是什么。当以后触发特定关键词的时候,它会去召回这段记忆。
这些内容也是 Codex 自动记录、以后会自动召回去使用的。
我们也可以先不去修改它,格式确实也不方便修改。
更多时候,对于明确的规则和要求,还是组织 agents.md来实现。
生图其实只是 Codex 的一个小功能。
所以这一章节,我们会用生图能力做一个完整的个人主页项目,顺便再感受一下 Codex 在小白开发里的实际工作方式~
那我们新开一个项目,就叫「个人主页」。
6.1 打开计划模式,先讨论再动手
点这里的加号,把“计划模式”打开。
做网站这种任务会稍微复杂一点,计划模式会先帮我们整理需求、生成完整计划,再正式开始执行。
我们没想清楚也没关系,直接说想做一个个人主页。
它一看项目里没有内容,就会以选择框的方式问我们细节。
这些选项我们按自己的要求选就行,选完,它会自动整理出一份完整方案,问我们要不要按这个计划开始执行。
整体我觉得已经没什么问题了,不过我们还可以继续补充需求。
提交之后,它还会继续追问,确认之后,Codex 就正式开始初始化项目、一步步生成网页了。
6.2 执行中可以随时纠偏
生成过程中,如果你发现它跑偏了,还能随时纠偏。
比如这个图片我不太满意,
发送出去,它并不会立刻中断任务,我们可以看到右边这个引导按钮,它写着,不打断模型运行,在下次调用工具后发送过去。
这是非常好的一个功能,不用让它在错误的道路上一路狂奔额度花光,也不会让它重新再跑一遍任务。
6.3 分叉 Fork:聊岔了可以回头
另外,我们找一个已经结束的任务,每个 AI 回复下面都有一个按钮:分叉 Fork。
意思是他可以让我们随时从这开始新开一个对话,非常适合前面还聊得好好的、上下文也很有价值,但往下聊就有点聊岔劈了的时候。
6.4 桌面宠物
点开设置里的外观,下面就有一队小宠物可选,甚至还可以点击创建一个根据你记忆生成的定制宠物。
点击唤醒宠物,桌面上就会有个常驻的小玩意,脑袋上会冒出 Codex 正在做什么的提示。
别的好像也没什么用~
6.5 内置预览浏览器
ok,刚才的主页任务完成了,我们来看看效果。
Codex有个内置的预览浏览器,可以直接在右边的侧边栏打开,
那它的这个预览浏览器还有个好处,点击右上角的批注按钮,就能在页面上选中具体元素去写修改意见,包括图片。
6.6 让 Codex 自己写项目级 agents.md
项目有了雏形,我们再 callback 一下刚刚的 agents.md。
现在就是让 Codex 自己帮我生成项目级 agents.md 的好时候,让它自己生成一下。
不错,项目的背景信息和各种规则都写进去了。无论我们再开新对话还是清空聊天记录,Codex 都能通过这个项目级的 agents.md 立马了解我们项目的基本情况~
ok,那先保持这样不做精修,直接准备部署上线~
在Codex中,插件大多是让Agent跟外部平台、外部工具、外部服务连接的作用。
点开左边的插件,这里已经默认帮我打开了好几个内置插件。
它的插件页面没有中文翻译,所以我把这些插件的具体中文意思、能干什么也都列在文档里啦👇~
https://my.feishu.cn/wiki/NATtwZKgmiS4JSk1I74c78lYnRb
7.1 一键部署上线
那我们看到coding板块,我们想要部署上线,通过插件会非常方便。
Vercel、Netlify 都可以。Vercel 更适合有域名的朋友,否则有时候国内访问有点问题。如果没有域名,国内访问 Netlify 会更好一点,点加号装好~
如果大家的 GitHub 没选上的也记得选上。
然后回到对话告诉他想用 Netlify 把网站部署上去。也别管咋部署,反正需要干啥他都会告诉我们~
最后搞定了,这个链接就是最后我们的网站了,发出去别人就能访问你的个人主页。如果想替换成自己买的域名,你懂的,问 Codex 教你操作就完了~
7.2 操控类的插件
我们回到刚刚我们已经安装的插件,里面其实还有三个非常重要的内置插件:Browser Use、Computer Use,还有 Chrome。
这三个简单说一下区别:
Browser Use:Codex 帮你开一个新的浏览器去点击、翻页、截图、填表单。
Chrome 插件:操控你自己已经登录的浏览器,不新开窗口。勾选之后会引导你装一个 Chrome 插件(任意 Chromium 内核的浏览器都行)。它还有个隐藏好处是可以在后台执行操作,不占用你的屏幕,你该用浏览器、该干别的,接着干就行。
Computer Use:最厉害的一个,不止能操控浏览器,连电脑上的 App 都能操控。不过暂时只有 Mac 有。
这三个东西文字讲完你大概率还没感觉,所以强烈建议你回顶部看视频的演示——我让 Codex 自己去做了个 MBTI 测试、还让它播音乐 + 操作微信,画面比文字直观 100 倍~
不过实际上我觉得这三个插件的操作效率目前还是有点低,我不太喜欢用~
而后面要说的这个 Skill,就是我每天都会用的东西了。
Skills 我确实已经说过很多次了,好学的朋友一定要去补补课~
本质上它是我们人为沉淀的一些可复用的方法、流程、和工具的组合,相当于 Agent 做某类具体任务的行动指南。
8.1 装别人写好的 Skill
之前已经让 Codex 帮我装过一个叫 find-skill 的元 Skill。后续想装、或者想找一些社区上的 Skill,都可以直接用一句话让 Codex 帮你下载。
8.2 自己创建 Skill 的两种方式
我在 CC 那期也说了,最好用的 Skill 还是自己创建的、符合自己工作的专属 Skill。
创建 Skill 也有 2 种方式:
直接告诉 Codex 你想创建一个什么样的 Skill,通过跟他讨论打磨得出。
先跑通流程,然后形成 Skill~这也是更推荐的做法。
那视频里也有一个案例,一个自动写 GitHub 热门项目推荐的 Skill,这里就不详细展开了,大家可以去看看顶部视频~
下一个能力就是 MCP~
其实 MCP 现在已经用得不多了,简单示范一下。
Codex 的 MCP 藏在设置里面的 MCP 服务器,
但小白看这个肯定不知道怎么填。跟之前说的一样,只需要把你想装的 MCP 链接拷贝给 Codex,让它自己装就完了。
比如想装 NotebookLM 的 MCP,把链接发给它。
它就会引导我们登录授权,搞定后Codex 也能直接获取我们 NotebookLM 上的外挂知识库了。
定时任务本身不稀奇,每天早上 9 点提醒我吃药、提醒我喝水...这类事普通软件也能做。
但还要说,是因为它可以结合之前学到的各种能力,把一整套组合起来的任务让 Agent 定点执行。自动化加上智能化和定制化,方显美妙。
比如我们有一个热门项目图文 Skill,就可以设成每 3 天或者每周让他定时定点产出一篇《本周 GitHub 热门项目推荐》发出来。那不就是一个自动社交媒体运营机器了吗?
感觉有用多了~
10.1 创建自动化任务的 2 种方式
10.1.1 方式一:在自动化面板里建
选到这边的自动化面板。这里有一些官方的参考示例,不过大多数是跟开发相关。
在右上角选择新建自动化功能,需要填写的非常简单:用提示词写好需要自动化做的是什么,再选择什么时候触发(可以自定义触发时间),然后选择执行的模型和思考强度,点击创建就可以了。
10.1.2 方式二:直接跟 Codex 说(推荐)
我还是倾向于让大家用第二种更简单的:直接在对话里跟 Codex 说。
直接说"帮我创建一个自动化任务,每周一早上 9 点,自动执行热门项目推荐的 Skill,产出一篇图文发到群里"。再看自动化这里,就已经设好了这个任务。
设置方法很简单,手机上的ChatGPT和电脑上的Codex都更新到最新版之后,打开手机的ChatGPT,点侧边栏的Codex,
它就会提示你在电脑上完成设置。然后在电脑中选择"允许这台手机控制这台电脑",直接就搞定了。
如果你有多台电脑,也可以分别给它连上。
这等于你不管在大街上、地铁上,还是朋友聚会上,都可以随时随地下发一个任务,让Codex在你的电脑上干完一个活,更像一个同事了。
这个功能目前免费版也能用,但主要能连Mac系统的Codex。
好,到这里 Codex 的所有核心能力就全部过完了。
我们来回顾一下这张图~
比起这些功能本身,我也希望大家能记住2件事,
我们很多事,真的可以交给Agent做了
我们已经从"问AI"走了到"管理AI"的阶段
现在用Codex这类Agent,每个人都得像领导一样:给它准备它需要的上下文和工作环境,给它指明任务目标,检查它的计划,监督它的过程,验收它的结果。
同时,领导还要负责把好的方法和流程沉淀成可复用的技能,把反复要做的事,设成自动化执行的规矩~
好啦,那我们想要真正把Codex用起来,还得动手跟着练~也建议大家点开视频实操!👇
视频里每一步都演示得很细,遇到细节命令再翻文档查🔗👇
https://my.feishu.cn/wiki/OCY5wzbGhiLDr8kMulkcLLuSnQd
最后,我们下次见啦~
邮箱:join@qiuzhi2046.com
邮件主题:应聘[岗位]-姓名-渠道
线下全职:深圳
感谢铁铁们也帮忙转发推荐呀~
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-19
两个开源 Skill,帮你搞定专利交底书和软著申请
2026-05-19
Agent Skills 实战:把设计文档(Design)写成 Skill
2026-05-19
Anthropic工程师是如何使用Claude的
2026-05-19
当我们在管 Skill 时,我们到底在管什么?
2026-05-18
PRD → Goal → After-Goal:AI 主导全流程研发实践
2026-05-18
别再把公众号只当信息流,微信读书 Skill 让知识库整理变简单了
2026-05-18
我又开源了一个群报纸 skill,让你的微信群每天都能产出一份高质量的报纸
2026-05-17
Perplexity:每一个 Skill 都是一项税
2026-04-05
2026-03-04
2026-03-03
2026-03-17
2026-03-05
2026-03-03
2026-03-10
2026-03-17
2026-03-26
2026-03-05