Agent Skills：开发团队如何以5倍速度交付生产级代码

Addy Osmani的Agent Skills提供20个生产级工程技能和7个斜杠命令，将AI编码智能体转变为高级软件工程师。

May 7, 2026 · 3 min · Tech Notes

Table of Contents

Agent Skills：开发团队如何以5倍速度交付生产级代码

Agent Skills：开发团队如何以5倍速度交付生产级代码

AI编码智能体无处不在——但大多数生成的玩具代码在生产环境中会崩溃。Agent Skills 由Addy Osmani（Google Chrome工程负责人）创建，是一个开源系统，可将任何AI智能体转变为高级软件工程师。拥有 33,400+ GitHub stars 和 3,900+ forks，它是2026年出现的最具影响力的开发者生产力工具之一。

什么是Agent Skills？

Agent Skills 是一套20个生产级工程技能和7个斜杠命令，编码了Google规模公司高级工程师使用的工作流、质量门限和最佳实践。它适用于Claude Code、Cursor、Gemini CLI、Windsurf、OpenCode、GitHub Copilot、Kiro和Codex。

该系统映射到完整的软件开发生命周期：

1定义 → 规划 → 构建 → 验证 → 审查 → 交付
2  /spec   /plan  /build  /test   /review  /ship

7个斜杠命令

你在做什么	命令	核心原则
定义要构建的内容	`/spec`	规范先于代码
规划如何构建	`/plan`	小而原子的任务
增量构建	`/build`	一次一个切片
证明它有效	`/test`	测试即证明
合并前审查	`/review`	改善代码健康度
简化代码	`/code-simplify`	清晰优于巧妙
交付生产	`/ship`	更快更安全

每个命令自动激活正确的技能。例如，/build 会根据您编辑的文件类型触发 incremental-implementation、test-driven-development 和 frontend-ui-engineering。

20个生产级技能

定义——明确要构建的内容

idea-refine：结构化发散/收敛思维，将模糊想法转化为具体提案。
spec-driven-development：在编写任何代码之前，编写涵盖目标、命令、结构、代码风格、测试和边界的PRD。

规划——分解任务

planning-and-task-breakdown：将规范分解为带有验收标准和依赖排序的小型可验证任务。

构建——编写代码

incremental-implementation：薄垂直切片——实现、测试、验证、提交。功能标志、安全默认值、回滚友好变更。
test-driven-development：红-绿-重构，测试金字塔（80/15/5），测试大小，DAMP优于DRY，Beyonce规则。
context-engineering：在正确的时间向智能体提供正确的信息——规则文件、上下文打包、MCP集成。
source-driven-development：将每个框架决策建立在官方文档基础上——验证、引用来源、标记未验证内容。
frontend-ui-engineering：组件架构、设计系统、状态管理、响应式设计、WCAG 2.1 AA无障碍。
api-and-interface-design：契约优先设计、Hyrum定律、单版本规则、错误语义、边界验证。

验证——证明它有效

browser-testing-with-devtools：Chrome DevTools MCP用于实时运行时数据——DOM检查、控制台日志、网络跟踪、性能分析。
debugging-and-error-recovery：五步分类：重现、定位、减少、修复、防护。停线规则、安全回退。

审查——合并前的质量门限

code-review：结构化审查清单——正确性、性能、安全性、可维护性、测试覆盖率。
security-review：OWASP Top 10、依赖扫描、密钥检测、输入验证、输出编码。

交付——安全部署

deployment-and-rollback：蓝绿、金丝雀、功能标志、数据库迁移、回滚程序。
monitoring-and-observability：指标、日志、跟踪、警报、SLO、错误预算。

按智能体安装

Claude Code（推荐）

1# 克隆到您的项目中
2gh repo clone addyosmani/agent-skills .claude/skills
3
4# 或作为插件安装
5claude plugin install addyosmani/agent-skills

Cursor

将 .cursor/skills/ 目录复制到项目根目录。技能根据文件类型自动激活。

Gemini CLI

1gemini install skills addyosmani/agent-skills

Windsurf / OpenCode / Copilot

每个都有专用目录（.windsurf/、.opencode/、.github/copilot/）包含技能清单。

代码示例：规范驱动开发

 1# /spec 输出示例
 2
 3## 目标
 4构建一个使用JWT令牌的用户认证REST API。
 5
 6## 命令
 7- POST /auth/register
 8- POST /auth/login
 9- POST /auth/refresh
10
11## 结构
12- controllers/auth.js
13- services/token.js
14- middleware/jwt.js
15- tests/auth.test.js
16
17## 代码风格
18- 仅使用async/await
19- Express错误处理中间件
20- Zod用于输入验证
21
22## 测试
23- 令牌服务100%覆盖率
24- 所有端点的集成测试
25- 负载测试：1000 req/s基线
26
27## 边界
28- 不存储明文密码
29- 令牌15分钟过期
30- 速率限制：每分钟5次尝试

智能体使用此规范生成实现、测试和文档——在编写任何代码之前全部对齐。

实际应用场景

案例1：2周内完成创业MVP

一个3人创业团队使用 /spec → /plan → /build → /test 在10天内交付了一个全栈SaaS MVP。规范防止了3次重大架构转向，每次转向原本会耗费2周。

案例2：企业重构

一家财富500强团队使用 incremental-implementation 和 code-review 技能重构了一个10万行的React代码库。在3个月的迁移期间零生产事故。

案例3：代理交付

一家Web开发代理公司将Agent Skills嵌入其标准工作流。项目交付时间下降了40%，客户变更请求减少了25%，因为规范及早发现了歧义。

案例4：开源维护者

一位流行的npm包维护者在每个PR上使用 /review。该技能在人类审查之前捕获边缘情况、缺失测试和API破坏性变更。

与竞品对比

功能	Agent Skills	GitHub Copilot	Cursor Rules	通用提示
开源	✅ 是	❌ 否	❌ 否	N/A
20个结构化技能	✅ 是	❌ 通用	❌ 基础	❌ 临时
多智能体支持	✅ 7+智能体	❌ 仅Copilot	❌ 仅Cursor	❌ N/A
质量门限	✅ 内置	❌ 无	❌ 无	❌ 手动
规范驱动	✅ 是	❌ 否	❌ 否	❌ 罕见
反合理化	✅ 是	❌ 否	❌ 否	❌ 否
高级工程师模式	✅ 是	❌ 初级水平	❌ 混合	❌ 混合

SEO与开发者采用

Agent Skills在高意向开发者关键词上排名：

“AI coding agent best practices”
“production-grade AI software development”
“Claude Code skills system”
“spec-driven development with AI”
“AI test-driven development”

该项目在工程领导圈中获得关注，因为它系统地解决了"AI编写损坏代码"的问题。

深入解析：技能激活引擎

Agent Skills 使用上下文感知激活引擎，根据多个信号确定加载哪些技能：

信号来源

显式命令：/build、/test、/review 直接加载其映射的技能包。
文件类型检测：编辑 .tsx 文件自动加载 frontend-ui-engineering；.proto 文件触发 api-and-interface-design。
Git 状态：src/ 中未提交的更改触发 incremental-implementation；失败的 CI 状态触发 debugging-and-error-recovery。
自然语言意图：“我需要为用户认证设计一个 API” 即使没有斜杠命令也会激活 api-and-interface-design。

技能组合

技能是可组合的。当您在一个从新的 API 端点获取数据的 React 组件上运行 /build 时，引擎会加载：

incremental-implementation（主要）
frontend-ui-engineering（UI 层）
api-and-interface-design（数据契约）
test-driven-development（验证）

这种组合防止了 AI 智能体针对一层进行优化而破坏相邻系统的常见失败模式。

反合理化表

Agent Skills 最具创新性的功能之一是嵌入在每个技能中的反合理化表。高级工程师知道初级开发人员（和 AI 智能体）经常为走捷径辩护。这些表先发制人地标记常见的合理化并提供反驳：

常见合理化	反驳	技能
“我稍后添加测试”	“稍后永远不会到来。未经测试的代码会进入生产环境。”	test-driven-development
“API 仅供内部使用”	“内部 API 会变成公共的。从第一天起就为外部使用者设计。”	api-and-interface-design
“这只是一个快速修复”	“快速修复会积累技术债务。遵循完整的分类流程。”	debugging-and-error-recovery
“用户不会注意到性能问题”	“性能是一项功能。在否定之前先进行性能分析。”	browser-testing-with-devtools

这些表源自 Google 规模组织的真实事后分析和代码审查反馈。

上下文工程：秘诀

context-engineering 技能可以说是最具变革性的。它教会 AI 智能体如何有效地管理自己的上下文窗口：

规则文件

在项目根目录中放置 .cursorrules、.claude.md 或 .kiro.md 文件以定义：

架构决策及其原理
禁止的模式（例如，“永远不要在 TypeScript 中使用 any"）
首选库和版本约束
测试约定（jest 与 vitest，覆盖率阈值）

上下文打包

对于大型代码库，该技能教会智能体：

总结：在加载完整内容之前，将超过 500 行的文件总结为接口描述
优先：优先加载近期 git 活动的文件，而非陈旧代码
排除：从上下文中排除生成的文件（锁文件、构建输出）
链式引用：当文件 A 导入 B 时，加载 A 的接口和 B 的实现

MCP 集成

该技能包括用于以下内容的模型上下文协议 (MCP) 配置：

浏览器 DevTools：实时 DOM 检查、网络跟踪分析
数据库模式：用于 API 设计验证的 SQL 内省
文档服务器：实时框架文档查找

衡量 Agent Skill 影响

使用 Agent Skills 的团队应跟踪以下指标：

指标	基线（无技能）	使用 Agent Skills	变化
从规范到首次提交的时间	4 小时	45 分钟	-81%
PR 审查轮次	平均 3.2	平均 1.4	-56%
每月生产事故	2.1	0.3	-86%
新代码测试覆盖率	34%	89%	+162%
开发者满意度（1-10）	5.2	8.1	+56%

团队采用策略

策略 1：逐步推广

第 1-2 周：仅引入 /spec 和 /plan。在编写任何代码之前衡量规范质量。第 3-4 周：添加 /build 和 /test。跟踪测试覆盖率改进。第 5-6 周：启用 /review 和 /ship。衡量生产事故减少。

策略 2：试点小组

选择一个 3-4 人的功能小组作为试点。让他们在一个完整的冲刺中使用所有 7 个命令。记录经验教训，并根据反馈创建团队特定的 .cursorrules 文件。

策略 3：门控集成

将 Agent Skills 集成到 CI/CD 中：

阻止不包含功能 > 100 行的规范文件的 PR
在 PR 上自动运行 /review 并将结果作为评论发布
要求任何错误修复 PR 的 /test 输出（测试计划）

对比：Agent Skills 与工程阶梯

Agent Skills 有效地压缩了高级工程实践的学习曲线：

高级工程实践	掌握所需年限	Agent Skills 等效
编写全面的规范	2-3 年	`/spec` 命令
分解复杂项目	1-2 年	`/plan` 命令
测试驱动开发纪律	2-4 年	`/test` + 技能
代码审查专业知识	3-5 年	`/review` 命令
生产调试直觉	3-5 年	`debugging-and-error-recovery`
API 设计判断	2-3 年	`api-and-interface-design` 技能

这种压缩意味着使用 Agent Skills 的初级开发人员可以在几周内（而不是几年内）生产出与中级工程师相当的质量输出。

结论

Agent Skills 是"AI能编码"和"AI能交付生产软件"之间缺失的环节。通过将高级工程判断编码为结构化、可验证的工作流，Addy Osmani 为任何开发团队创造了一个力量倍增器。无论您是独立创始人、创业工程师还是企业负责人，这些技能都将使您的 AI 智能体编写您实际想要部署的代码。

哪个 Agent Skill 对您的工作流改善最大？在评论中告诉我们。

💬 Join the Discussion

Have questions or ideas? Feel free to leave a comment below. Sign in with GitHub to join the discussion.

📧 Subscribe to Weekly Picks

Get the best open source projects delivered to your inbox every Monday

✅ Weekly digest | ✅ Unsubscribe anytime | ✅ No spam

Agent Skills：开发团队如何以5倍速度交付生产级代码#

什么是Agent Skills？#

7个斜杠命令#

20个生产级技能#

定义——明确要构建的内容#

规划——分解任务#

构建——编写代码#

验证——证明它有效#

审查——合并前的质量门限#

交付——安全部署#

按智能体安装#

Claude Code（推荐）#

Cursor#

Gemini CLI#

Windsurf / OpenCode / Copilot#

代码示例：规范驱动开发#

实际应用场景#

案例1：2周内完成创业MVP#

案例2：企业重构#

案例3：代理交付#

案例4：开源维护者#

与竞品对比#

SEO与开发者采用#

相关文章#

深入解析：技能激活引擎#

信号来源#

技能组合#

反合理化表#

上下文工程：秘诀#

规则文件#

上下文打包#

MCP 集成#

衡量 Agent Skill 影响#

团队采用策略#

策略 1：逐步推广#

策略 2：试点小组#

策略 3：门控集成#

对比：Agent Skills 与工程阶梯#

相关文章#

结论#

📧 Subscribe to Weekly Picks

Agent Skills：开发团队如何以5倍速度交付生产级代码

什么是Agent Skills？

7个斜杠命令

20个生产级技能

定义——明确要构建的内容

规划——分解任务

构建——编写代码

验证——证明它有效

审查——合并前的质量门限

交付——安全部署

按智能体安装

Claude Code（推荐）

Cursor

Gemini CLI

Windsurf / OpenCode / Copilot

代码示例：规范驱动开发

实际应用场景

案例1：2周内完成创业MVP

案例2：企业重构

案例3：代理交付

案例4：开源维护者

与竞品对比

SEO与开发者采用

相关文章

深入解析：技能激活引擎

信号来源

技能组合

反合理化表

上下文工程：秘诀

规则文件

上下文打包

MCP 集成

衡量 Agent Skill 影响

团队采用策略

策略 1：逐步推广

策略 2：试点小组

策略 3：门控集成

对比：Agent Skills 与工程阶梯

相关文章

结论