微信扫码
添加专属顾问
我要投稿
OpenAI Codex Skills 深度解析:如何将通用AI转变为领域专家,实现代码编写与Bug修复的自动化革命。核心内容: 1. Codex作为软件工程Agent的核心能力与定位 2. Agent Skills开放标准如何扩展AI的专业能力 3. Codex Skills的三级加载机制与社区驱动生态
Codex 是 OpenAI 于 2025 年推出的云端软件工程 Agent,它可以:
Codex 的定位是软件工程 Agent,而非简单的代码补全工具。
Agent Skills 是由 Anthropic 开发并开源的一种轻量级、开放格式标准(agentskills.io),用于扩展 AI Agent 的能力和专业知识。
核心理念:Write once, use everywhere(一次编写,处处可用)。
Skills 本质上是一组包含指令、脚本和资源的文件夹,AI Agent 可以自动发现并使用这些 Skills 来执行特定任务。
OpenAI 的 Codex 采用了 Anthropic 的 Agent Skills 开放标准,并在此基础上构建了自己的 Skills 生态系统(GitHub: openai/skills)。
| 开放标准 | |
| 实现方案 | |
| Skills 仓库 |
这种设计将通用 AI Agent 转变为领域专家,使其具备模型本身无法完全掌握的程序性知识(Procedural Knowledge)。
| 可复用性 | |
| 模块化 | |
| 渐进式加载 | |
| 开放标准 | |
| 社区驱动 |
skill-name/├── SKILL.md # 必需:核心指令文件│ ├── YAML frontmatter # 元数据(name + description)│ └── Markdown body # 详细指令├── agents/ # 推荐:UI 元数据│ └── openai.yaml # 界面展示配置└── Bundled Resources/ # 可选:捆绑资源├── scripts/ # 可执行脚本(Python/Bash)├── references/ # 参考文档└── assets/ # 输出资源(模板、图标等)
SKILL.md 是每个 Skill 的核心,由两部分组成:
---name: skill-namedescription: 完整描述 Skill 功能和触发场景---
关键设计决策:
description 是 主要触发机制,决定 Agent 何时使用该 SkillBody 部分包含详细的使用指令,只有在 Skill 被触发后才会加载到上下文中。
这是 Agent Skills 最精妙的技术设计之一:
┌─────────────────────────────────────────────────────────────┐│ Level 1: Metadata (name + description) ││ ├── 始终在上下文中 ││ └── 约 100 词 │├─────────────────────────────────────────────────────────────┤│ Level 2: SKILL.md Body ││ ├── 仅在 Skill 触发时加载 ││ └── < 5000 词 │├─────────────────────────────────────────────────────────────┤│ Level 3: Bundled Resources ││ ├── 按需加载 ││ └── 无限制(脚本可直接执行,无需加载到上下文) │└─────────────────────────────────────────────────────────────┘
设计哲学:上下文窗口是公共资源,必须高效利用。
用途:需要确定性可靠性或重复编写的可执行代码
示例:
# scripts/rotate_pdf.pyPDF 旋转脚本,避免每次重写相同代码
优势:
用途:供 Agent 在工作时参考的文档资料
最佳实践:
组织模式:
# 按领域组织(BigQuery 示例)bigquery-skill/├── SKILL.md└── references/├── finance.md # 收入、计费指标├── sales.md # 机会、管道└── product.md # API 使用、功能
用途:不加载到上下文,而是用于输出的文件
示例:
assets/logo.png)assets/slides.pptx)assets/hello-world/)这是一个元 Skill,用于创建新的 Skills。
核心脚本:
init_skill.py |
|
generate_openai_yaml.py |
|
quick_validate.py |
创建流程:
# 1. 初始化 Skillscripts/init_skill.py my-skill --path skills/public --resources scripts,references# 2. 编辑 SKILL.md 和资源文件# 3. 验证 Skillscripts/quick_validate.py <path/to/skill-folder>
自由度设计原则:
| 高 | ||
| 中 | ||
| 低 |
功能:从 GitHub 仓库安装 Skills
核心命令:
# 列出可用 Skillsscripts/list-skills.py# 安装 curated Skillscripts/install-skill-from-github.py --repo openai/skills --path skills/.curated/<skill-name># 安装 experimental Skillscripts/install-skill-from-github.py --url https://github.com/openai/skills/tree/main/skills/.experimental/<skill-name>
安装位置:$CODEX_HOME/skills/<skill-name>(默认 ~/.codex/skills)
触发场景:终端浏览器自动化(导航、表单填充、截图、数据提取)
核心工作流:
# 1. 设置路径export PWCLI="$CODEX_HOME/skills/playwright/scripts/playwright_cli.sh"# 2. 核心循环"$PWCLI" open https://example.com"$PWCLI" snapshot # 获取稳定元素引用"$PWCLI" click e3 # 使用引用交互"$PWCLI" snapshot # 导航后重新快照
关键设计:
npx 包装器,无需全局安装e15)基于快照,导航后需重新获取触发场景:调试或修复 GitHub PR 检查失败
工作流:
1. 验证 gh 认证2. 解析 PR(当前分支或指定)3. 检查失败的 GitHub Actions4. 获取日志并总结失败原因5. 创建修复计划6. 用户批准后实施7. 重新检查状态
核心脚本:
python scripts/inspect_pr_checks.py --repo "." --pr "123" --json
触发场景:Figma URL、节点 ID、设计转代码
必需流程:
1. get_design_context → 获取节点结构化表示2. get_metadata → 响应过大时获取高层节点映射3. get_screenshot → 获取视觉参考4. 下载资产并开始实现5. 转换为项目约定(React + Tailwind → 项目风格)6. 与 Figma 验证 1:1 视觉一致性
资产处理规则:
触发场景:"deploy my app"、"push this live"
核心逻辑:
# 检查 CLIcommand -v vercel# 部署(默认 preview,非 production)vercel deploy [path] -y # 10 分钟超时# 回退方案(无认证时)bash "$skill_dir/scripts/deploy.sh" /path/to/project
触发场景:检查 Sentry issues、总结生产错误
API 端点:
/api/0/projects/{org}/{project}/issues/ |
|
/api/0/issues/{issue_id}/ |
|
/api/0/issues/{issue_id}/events/ |
|
/api/0/projects/{org}/{project}/events/{event_id}/ |
安全规则:
agents/openai.yaml 是面向机器/界面的配置文件:
interface:display_name: "用户可见名称"short_description: "简短描述(25-64字符)"icon_small: "./assets/small-400px.png"icon_large: "./assets/large-logo.svg"brand_color: "#3B82F6"default_prompt: "Use $skill-name to..."dependencies:tools:- type: "mcp"value: "github"description: "GitHub MCP server"transport: "streamable_http"url: "https://api.githubcopilot.com/mcp/"
关键约束:
default_prompt 必须显式提及 $skill-name"上下文窗口是公共资源。"
禁止创建:
Skill 只包含 AI Agent 完成任务所需的信息,不包含创建过程、设置测试、用户文档等辅助内容。
使用 Skill → 发现问题 → 识别改进点 → 实施更新 → 再次测试
| System | .system/ |
|
| Curated | .curated/ |
|
| Experimental | .experimental/ |
Skills 在以下 Codex 产品中可用:
Codex 支持两种 Skill 激活方式:
| 显式调用 | /skills 或 $skill-name |
|
| 隐式调用 | description |
重要:隐式匹配依赖
description字段,因此必须清晰描述 Skill 的适用范围和边界。
用户请求 → Codex 读取所有 Skill 的元数据(name, description, 路径, openai.yaml)→ 匹配相关 Skill→ 加载完整 SKILL.md 指令→ 按需读取 references/→ 执行 scripts/ 或生成代码→ 返回结果
Codex 从多个位置读取 Skills,按优先级扫描:
| REPO | $CWD/.agents/skills |
|
| REPO | $CWD/../.agents/skills |
|
| REPO | $REPO_ROOT/.agents/skills |
|
| USER | $HOME/.agents/skills |
|
| ADMIN | /etc/codex/skills |
|
| SYSTEM |
注意:如果两个 Skill 同名,Codex 不会合并它们,两者都会出现在选择器中。支持符号链接。
Codex 在云端沙箱中运行,Skills 需要考虑:
sandbox_permissions=require_escalated |
|
$CODEX_HOME 存储 Skill 数据 |
|
安装 Skills:
# 使用内置安装器$skill-installer install the linear skill from the .experimental folder# 从其他仓库安装$skill-installer install https://github.com/openai/skills/tree/main/skills/.curated/playwright
启用/禁用 Skills:
在 ~/.codex/config.toml 中配置:
[[skills.config]]path = "/path/to/skill/SKILL.md"enabled = false
修改配置后需重启 Codex。
最简单的方式是使用内置的 $skill-creator:
$skill-creator
创建器会询问:
创建一个包含 SKILL.md 文件的文件夹:
mkdir -p .agents/skills/my-skill
SKILL.md 模板:
---name: skill-namedescription: 清晰说明该 Skill 何时应该触发,何时不应该触发。---Codex 需要遵循的具体指令。
Codex 会自动检测 Skill 变更。如果更新未生效,重启 Codex。
# 使用 init_skill.py 脚本python scripts/init_skill.py my-skill --path .agents/skills --resources scripts,references# 验证 Skill 结构python scripts/quick_validate.py .agents/skills/my-skill/
添加 agents/openai.yaml 配置 UI 元数据和调用策略:
interface:display_name: "用户可见名称"short_description: "简短描述"icon_small: "./assets/small-logo.svg"icon_large: "./assets/large-logo.png"brand_color: "#3B82F6"default_prompt: "Use $my-skill to..."policy:allow_implicit_invocation: false # 禁用隐式调用dependencies:tools:- type: "mcp"value: "github"description: "GitHub MCP server"transport: "streamable_http"url: "https://api.githubcopilot.com/mcp/"
关键配置项:
allow_implicit_invocation |
true;设为 false 时,Codex 不会隐式调用该 Skill,但显式 $skill 调用仍有效 |
dependencies.tools |
description,确认触发行为正确description 中明确说明何时应该/不应该使用该 SkillOpenAI Codex Skills 代表了 AI Agent 能力扩展的一种优雅范式。通过模块化、渐进式加载和开放标准,它解决了 AI Agent 在特定领域任务中的知识局限性问题。
这套架构的核心洞察是:将程序性知识外部化,让 Codex 能够像人类专家一样,在需要时查阅"操作手册",而不是试图将所有知识都塞进模型参数中。
| Agent Skills | |
| Codex | |
| Codex Skills | |
| SKILL.md | |
| 渐进式披露 | |
| 触发机制 |
| Agent Skills 开放标准 | |
| Anthropic Skills 示例 | |
| OpenAI Codex Skills | |
| Codex 官方文档 |
对于开发者而言,理解并掌握 Agent Skills 的设计理念,将有助于构建更高效、更可维护的 AI 辅助工作流,并为自己的团队创建定制化的 Skills。由于这是一个开放标准,你创建的 Skills 可以在支持该标准的任何 AI Agent 中使用。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-03-05
一个Skill,治好了所有AI模型的“洋毛病”
2026-03-05
Skills:从编程工具的配角到Agent研发的核心
2026-03-04
OpenCode进阶指南:MCP协议与Skill技能,让你的AI助手真正"开外挂"
2026-03-04
给我的 OpenClaw 小龙虾装上声音,感觉它活了过来。
2026-03-04
Claude Code 确实强,但我的钱包顶不住:手把手教你低成本部署 Agent Skill
2026-03-04
装上这个 Skill,让你的 Claude Code 变成内容生产线,一键搞定出稿、出图、排版、推送……
2026-03-03
Agent Skills:把提示词升级成“员工手册”,让 Agent 真正可复用、可规模化
2026-03-03
Skills 真的可以帮我干活了:把工单分析变成一个可复用的 Skill
2026-03-02
2026-03-03
2026-03-02
2026-03-03
2026-03-04
2026-03-04
2026-03-04
2026-03-04
2026-03-05
2026-03-05