2026 年的 AI 编程助手领域经历了戏剧性的转变。从最初的基于聊天代码补全,发展到能够进行完整功能开发的自主代理——但大多数这类代理仍然产生初级水平的输出,因为它们缺乏区分好代码与优秀代码的结构化工作流程。Addy Osmani 推出的 Agent Skills 迅速成为解决这一问题的终极方案。该项目在 GitHub 上已获得超过 38,000 个 Star,并以每天超过 1,000 个 Star 的速度快速增长。Agent Skills 将资深员工工程师使用的软件工程方法论打包成可操作的、AI 可执行的技能文件。这不仅仅是一个提示词库——它是一个完整的、适用于 Claude Code、Cursor、Gemini CLI、GitHub Copilot、Windsurf、OpenCode、Kiro 和 Codex 的跨平台生产级工程纪律系统。
本全面评测探讨 Agent Skills 如何将 AI 编程代理从有用的助手转变为有纪律的高级开发者,分析其架构、22 个生命周期技能、安装流程、实际应用场景,以及为什么 Google 杰出工程师 Addy Osmani 认为每个使用 AI 编码的团队都需要立即采用这套方案。
Agent Skills 是什么?
Agent Skills 是一个精心策划的 22 个结构化工程工作流集合,专门为 AI 编程代理设计。每个技能都编码了经过验证的软件工程方法论——测试驱动开发、源码驱动开发、安全加固、性能优化等等——并将其转化为 AI 代理可以一致遵循的分步流程。
由 Addy Osmani(Google 杰出工程师)创建,他以 Web 性能基准、Lighthouse 项目和 Chromium 渲染管线的基础性工作而闻名,Agent Skills 代表了数年提炼的最佳实践,并以 AI 可访问的格式打包呈现。
项目统计
| 指标 | 数值 |
|---|---|
| GitHub Star 数 | 38,093+ |
| Fork 数 | 4,235+ |
| 待处理问题 | 85 个 |
| 近期提交 | 174 次提交(活跃开发中) |
| 主要语言 | Markdown + YAML frontmatter + Shell |
| 许可证 | MIT |
| 创建者 | Addy Osmani(Google 杰出工程师) |
| 每日增长 | ~1,000 Star/天 |
| 支持平台 | 8+ AI 编码工具 |
| 话题标签 | agent-skills, antigravity, claude-code, cursor, skills |
与传统的文档或参考指南不同,Agent Skills 采用了根本不同的方法。它不要求 AI 代理阅读长篇文档并推断正确的程序,而是将每个技能构建为具有清晰步骤、验证检查点、退出标准甚至"反合理化“表格的可执行工作流——后者预先阻止代理通常用来跳过重要步骤的借口。
为什么高级工程师工作流对 AI 代理至关重要
AI 编程代理面临的根本挑战不在于编写代码的能力——现代模型在生成语法正确的代码方面表现出色。真正的挑战在于工程纪律:知道何时在实现之前编写测试、如何以契约优先的方式设计 API、是否应该优先考虑简洁性而非巧妙性,以及在部署前如何识别潜在的安全漏洞。
资深工程师将这些决定归功于几十年来经验编码的直觉。他们本能地知道应在将用户输入传递给数据库之前进行验证,应在部署复杂更改之前实施功能标志,应在优化之前测量性能。没有明确指导的情况下,AI 代理倾向于选择阻力最小的路径——这通常意味着跳过规范、匆忙完成测试,并产生能运行但不易扩展或维护的代码。
Agent Skills 直接解决了这一差距。通过将资深工程师的工作流编码为机器可读格式,该项目确保 AI 代理在生产环境中遵循经验丰富的团队所使用的同样严格的过程。结果产生的代码不仅功能正常——而且遵循行业标准的测试、安全、性能、无障碍性和文档编写实践。
核心架构:从想法到上线
Agent Skills 映射到完整的软件开发生命周期,围绕六个阶段组织,配备七个斜杠命令和 22 个细粒度技能。以下是系统的工作原理:
定义 → 规划 → 构建 → 验证 → 审查 → 发布
/spec /plan /build /test /review /ship
每个阶段包含特定技能,技能也会根据上下文自动激活——设计 API 会触发 api-and-interface-design 技能,构建 UI 组件会触发 frontend-ui-engineering,编写新功能会触发 incremental-implementation。
第一阶段:定义——明确要构建什么
在任何代码编写之前,Agent Skills 通过两个关键技能强制执行正确的定义:
创意细化(idea-refine)——结构化的发散和收敛思维,将模糊概念转化为具体可行的建议。当您有一个需要探索的大致想法时,该技能引导广泛的头脑风暴和聚焦缩小,以得出良好定义的概念。这一步确保团队和代理在投入任何开发资源之前就充分理解需求和目标。
规格驱动开发(spec-driven-development)——在编写任何代码之前,此技能强制创建产品需求文档(PRD),涵盖目标、架构、代码样式约定、测试策略和清晰的边界。它防止了在未充分了解完整范围之前就直接进入实施的常见陷阱。一份好的 PRD 不仅是开发指南,也是后续代码审查和质量评估的标准依据。
第二阶段:规划——分解任务
规划和任务分解(planning-and-task-breakdown)——将规范分解为小的、可独立验证的任务,附带验收标准和依赖排序。这确保 AI 代理一次只处理一个原子单元,而不是尝试令人望而生畏的庞大单体实现。每次只关注一个小任务可以降低出错概率,也让代码变更更容易理解和回滚。
第三阶段:构建——编写代码
这一阶段包含了 Agent Skills 的大部分专业能力,拥有八个专门技能:
增量实施(incremental-implementation)——通过迭代循环模式实施薄层垂直切片:实施、测试、验证、提交。包括功能标志、安全默认值和回滚友好型变更,适用于任何涉及多个文件的修改。这种增量方式确保每一行新增代码都有充分的测试覆盖和明确的用途。
测试驱动开发(test-driven-development)——强制执行红-绿-重构循环,采用测试金字塔方法(80% 单元测试、15% 集成测试、5% 端到端测试)。遵循 DAMP(描述性与有意义短语)优于 DRY 原则,应用"碧昂斯规则”(不要重复自己),并提供浏览器测试策略。TDD 的核心价值在于它迫使你在编写代码之前先思考接口的行为和期望。
上下文工程(context-engineering)——教代理如何适时地向自己提供正确信息,通过规则文件、上下文封装和 MCP 集成来实现。在开始新会话、切换任务或注意到输出质量下降时尤其有用。良好的上下文管理是 AI 代理产生高质量输出的前提条件。
源码驱动开发(source-driven-development)——将每个框架决策建立在官方文档的基础上——要求代理验证声明、引用来源并标记任何未经证实的内容。这大幅减少了幻觉代码和 API 误用的情况。当面对快速迭代的框架时,这一技能尤为重要,因为过时的教程可能会导致严重后果。
怀疑驱动开发(doubt-driven-development)——针对高风险决策的对立式全新上下文审查流程,遵循 CLAIM → EXTRACT → DOUBT → RECONCILE → STOP 方法论。特别适用于生产部署、安全敏感代码或不熟悉代码库中的场景,因为这些地方自信但错误的输出比及时验证代价更大。这一技能体现了高级工程师的自我批判精神。
前端 UI 工程(frontend-ui-engineering)——涵盖组件架构、设计系统、状态管理、响应式设计和 WCAG 2.1 AA 无障碍合规性,用于构建用户界面。UI 开发不仅需要功能性,还需要可访问性和用户体验的深度考虑。
API 和接口设计(api-and-interface-design)——合同优先的设计方法,遵守 Hyrum 定律、单一版本规则、proper 错误语义和边界验证,用于设计稳健的 API 和模块边界。一个好的 API 设计能在开发初期避免大量后期重构。
第四阶段:验证——证明其有效
浏览器 DevTools 测试(browser-testing-with-devtools)——使用 Chrome DevTools MCP 获取实时运行时数据,包括 DOM 检查、控制台日志、网络追踪和性能分析。对于任何在浏览器环境中运行的代码都必不可少。
调试与错误恢复(debugging-and-error-recovery)——五步故障排除方法学:复现、定位、缩小、修复、防护。包括"停止运营"规则和安全回退模式,用于处理意外失败。高效的调试能力是区分初级和高级工程师的重要标志。
第五阶段:审查——合并前的质量门禁
代码审查与质量(code-review-and-quality)——五轴审查流程,附带变更大小指南(每约 100 行变更)、严重性标签(Nit/可选/FYI)、审查速度规范和拆分策略,以保持拉取请求的可管理性。好的代码审查不仅是找 bug,更是知识传递和标准统一的途径。
代码简化(code-simplification)——应用 Chesterton 栅栏原则和"五百行规则"来降低复杂度同时保留精确行为。强调清晰度优于巧妙性。复杂系统的最大敌人不是缺少功能,而是过度工程化。
安全加固(security-and-hardening)——OWASP Top 10 预防模式、认证最佳实践、密钥管理、依赖审计和三阶边界系统,用于处理用户输入、认证流程、数据存储和外部集成。安全不应是事后补充,而应从第一天就嵌入开发流程。
性能优化(performance-optimization)——测量优先的方法论,目标为 Core Web Vitals,包含分析工作流、包分析和反模式检测,用于识别性能回归。在没有测量的情况下谈优化就是盲目的猜测。
第六阶段:发布——自信部署
Git 工作流与版本控制(git-workflow-and-versioning)——主干开发配合原子提交、变更大小指南(每约 100 行)和"提交即保存点"模式,让任何代码变更都安全可控。
CI/CD 与自动化(ci-cd-and-automation)——左移质量原则、快即安全的部署哲学、功能标志生命周期、质量门禁管道和故障反馈环,用于构建和部署自动化。自动化是规模化团队的基石。
废弃与迁移(deprecation-and-migration)——代码即负债的思维模式,配合强制性与合作性废弃模式、迁移策略和僵尸代码移除技术。学会优雅地告别旧代码是工程成熟度的重要标志。
文档与架构决策记录(documentation-and-adrs)——架构决策记录(ADR)、API 文档标准、内联文档要求——专注于记录为什么做出某个决策,而不只是做了什么。好的文档能让后来的开发者少走弯路。
发布与启动(shipping-and-launch)——全面的发布前检查清单、功能标志生命周期管理、分阶段发布流程、回滚协议和监控设置,确保安全的生产部署。发布不是结束,而是新的开始。
元技能:发现适用哪个技能
使用 Agent Skills(using-agent-skills)——将 incoming 工作映射到适当的技能工作流,并为整个技能包定义共享操作规则。在开始新会话或决定哪些技能最相关时使用此技能。它是所有其他技能的入口点。
专家角色:专项审查视角
除核心技能外,Agent Skills 还包括三个预配置的专业人员角色,提供有针对性的专家审查:
| 角色 | 职责 | 视角 |
|---|---|---|
| 代码审查员 | 资深员工工程师 | 五轴代码审查,标准为"资深工程师是否会批准这段代码" |
| 测试工程师 | QA 专家 | 测试策略、覆盖率分析和"证明它"验证模式 |
| 安全审计员 | 安全工程师 | 漏洞检测、威胁建模和 OWASP 评估 |
这些角色可以独立调用,对你的代码库特定方面进行深入审查,提供单一审查者无法独自提供的多角度质量保证。
安装和使用方法
Claude Code(推荐方式)
通过 Claude Code 的插件市场安装是最简单的方式:
/plugin marketplace add addyosmani/agent-skills
/plugin install agent-skills@addy-agent-skills
如果遇到 SSH 克隆错误,改用 HTTPS URL:
/plugin marketplace add https://github.com/addyosmani/agent-skills.git
/plugin install agent-skills@addy-agent-skills
本地开发方式:
git clone https://github.com/addyosmani/agent-skills.git
claude --plugin-dir /path/to/agent-skills
Gemini CLI
作为原生技能安装以实现自动发现:
gemini skills install https://github.com/addyosmani/agent-skills.git --path skills
或从本地克隆安装:
gemini skills install ./agent-skills/skills/
其他平台
- Cursor:将任意
SKILL.md复制到.cursor/rules/,或引用完整的skills/目录 - Windsurf:将技能内容添加到 Windsurf 规则配置中
- OpenCode:通过
AGENTS.md和技能工具使用代理驱动的技能执行 - GitHub Copilot:使用
agents/中的代理定义作为 Copilot 角色,将技能内容放入.github/copilot-instructions.md - Kiro IDE & CLI:技能位于
.kiro/skills/,支持项目级和全局级 - Codex / 其他代理:技能为纯 Markdown 格式——适用于任何接受系统提示或指令文件的代理
七项斜杠命令
安装后,Agent Skills 提供映射到开发生命周期的七项斜杠命令:
| 命令 | 阶段 | 核心原则 |
|---|---|---|
/spec | 定义 | 先规格后代码 |
/plan | 规划 | 小而原子化的任务 |
/build | 构建 | 一次只做一小片 |
/test | 验证 | 测试即证明 |
/review | 审查 | 提升代码健康度 |
/code-simplify | 审查 | 清晰度优于巧妙性 |
/ship | 发布 | 越快越安全 |
实际应用案例
企业软件团队
采用 AI 编程助手的工程团队面临一致的问题:初级开发者在不进行测试或文档的情况下匆忙推出功能,而高级开发者花费大量时间审查生成的代码。Agent Skills 通过将高级别工程纪律直接嵌入 AI 代理的工作流程来解决这个问题。每项功能请求都经过规格审查、规划、带测试的增量实施、质量检查和适当文档——无论由哪个团队成员发起。
独立开发者和 Indie Hacker
快速构建产品的独立开发者经常为了速度牺牲质量。集成 Agent Skills 后,独立开发者在每个阶段都能获得自动的高级工程师审查。反合理化表阻止了常见的捷径,如"我稍后添加测试"或"安全审查可以等一下",结果是不需要扩大团队规模就能获得生产级代码。
AI 工具 builder 和插件开发者
构建 AI 驱动开发工具的团队可以将 Agent Skills 用作 AI 代理行为方式的参考实现。技能结构可作为设计代理交互模式的模板,已验证的参考资料(测试模式、安全检查清单、性能指标)可直接嵌入产品文档。
工程经理和技术负责人
评估 AI 编程工具的工程领导者需要确保他们的团队不会采用降低代码质量标准的工具。Agent Skills 提供了可衡量的质量门禁——测试覆盖率要求、安全扫描、性能基线——让管理者有信心确认 AI 辅助开发维持或提升了现有标准,而不是降低它们。
与其他方案对比
vs. 传统提示词库
大多数 AI 编程提示词库由描述所需行为的静态文本块组成。Agent Skills 从根本上不同——它将每项技能构建为具有编号步骤、验证检查点和定义退出标准的可执行工作流。传统提示词可能说"为此代码编写测试",而 Agent Skills 提供完整的 TDD 方法论,包括红-绿-重构循环、测试金字塔比例、命名惯例,甚至代理用来跳过测试的常见借口列表——配有记录的反对理由。
vs. Anthropic 金融服务仓库
Anthropic 的 financial-services 仓库专注于 Claude 模型的银行和金融科技应用。虽然在特定领域用例方面表现出色,但缺乏 Agent Skills 提供的全方位工程纪律。Agent Skills 适用于所有应用领域——Web 应用、API、命令行工具、数据管道——并覆盖整个开发生命周期,而不仅仅是特定垂直领域。
vs. 手动工程实践
即使内部工程文化很强,人为的不一致性也不可避免。两名资深工程师可能有不同的代码审查方法,疲劳会导致跳过步骤。Agent Skills 提供一致的、可重复的工程标准执行,无论谁在处理代码或有多疲惫。反合理化机制特别强大——它预测人类用来走捷径的具体理由并提前制止。
vs. 其他 AI 编程技能包
小型技能包通常只覆盖开发过程的一两个方面(例如仅测试或仅代码审查)。Agent Skills 提供覆盖从创意构思到生产发布的完整端到端方法论。它的七斜杠命令界面让你轻松激活开发所处阶段的正确技能,上下文感知的自动激活意味着相关任务被检测到时技能会自动触发。
核心设计原则
流程而非散文
技能是代理执行的工作流,而非阅读的资料文档。每项技能包含编号步骤、检查点和退出标准。这种结构差异之所以重要,是因为它将抽象建议转化为 AI 代理可以可靠执行的明确、可重复的动作。
反合理化表
每项技能包含一个表格,列出代理用来跳过的常见借口,并附有文档化的反驳。常见例子包括"我稍后添加测试"(反驳:技术债务以复利方式累积)、“这个太简单不需要测试”(反驳:最简单的代码在将来重构中最容易出问题)和"CI 已经覆盖了"(反驳:CI 捕获回归问题,测试捕获设计缺陷)。
验证不可妥协
每项技能结尾都有证据要求——测试通过、构建输出、运行时数据。“看起来对"永远不够。这种严格的验证姿态确保 AI 生成的代码满足可衡量的标准,而非主观意见。
渐进式信息披露
SKILL.md 文件是每个技能的入口点,支持参考资料(测试模式、安全检查清单、性能检查清单、无障碍检查清单)仅在需要时加载。这使 token 用量最小化,同时在需要时确保持有全面指导。
结论
Addy Osmani 的 Agent Skills 代表了 AI 编程代理持续产出高级别输出的重大突破。凭借超过 38,000 个 Star、每天增长超过 1,000 个、跨 8 种编码工具的支持,以及覆盖整个软件开发生命周期的 22 项综合技能方法论,它已成为任何认真对待 AI 辅助开发专业人士的首选资源。
该项目创新的方法——将资深工程师工作流编码为带有反合理化保障和非妥协验证要求的结构化可执行技能文件——解决了当前 AI 编程工具的根本弱点:它们倾向于通过走捷径产生初级水平的输出。无论你是想要高级别代码质量的个人开发者、寻求一致标准的工程管理者,还是构建 AI 驱动开发工具的团队,Agent Skills 都提供了使其实现的架构基础。
随着 2026 年 AI 编程工具的持续演变,像 Agent Skills 这样弥合 AI 能力和工程纪律之间差距的项目将把专业人员和业余爱好者区分开来。如果你今天正在使用任何 AI 编程助手,安装 Agent Skills 应该是你的最高优先级之一。