前言

过去一年,AI 编程工具的讨论重点已经从“模型够不够强”逐步转向“工作流够不够稳”。原因很简单:单纯依赖对话式提示词写代码,虽然快,但一旦项目变复杂,需求会漂移、上下文会丢失、执行会跑偏,最后往往变成典型的“vibe coding”——看起来写得很快,实际上维护成本很高。
在这种背景下,越来越多开发者开始关注“规范驱动开发”与“上下文工程”路线,也就是先把需求、设计、任务拆解、执行顺序和验收方式结构化,再交给 AI 编码助手去落地。最近讨论度很高的几个代表项目,正好覆盖了这条路线的不同流派:spec-workflow、Superpowers、OpenSpec 和 GSD。
这四个项目表面上都在谈 spec-driven development,但它们其实不是同一种东西。有的更像 Claude Code 的规范化脚手架,有的更像可组合的 agent 技能体系,有的试图做跨工具的轻量规范层,有的则进一步走向“长时间自治执行 + 子代理编排”的完整操作系统。把它们混成一类来看,很容易得出错误结论;只有拆开它们的方法论与目标用户,才能真正看懂谁适合谁。
一、先给结论:这 4 个项目分别代表了什么路线?
| 项目 | 核心定位 | 最突出的关键词 | 更适合谁 |
|---|---|---|---|
| spec-workflow | Claude Code 的规范化工作流 | Requirements → Design → Tasks → Implementation | 想把 Claude Code 用得更稳的新手与进阶用户 |
| Superpowers | 面向 coding agents 的技能框架与开发方法论 | skills、TDD、subagent-driven development | 希望让代理更像工程团队而不是聊天机器人的用户 |
| OpenSpec | 跨 AI 助手的轻量规范层 | 20+ assistants、轻量、开放工具链 | 不想绑定单一 IDE 或单一模型的团队 |
| GSD | 面向长周期自治执行的上下文工程系统 | meta-prompting、subagents、atomic commits | 重度自动化开发、复杂项目推进者 |
一句话概括:
- spec-workflow 适合把 Claude Code 从“会写代码”提升到“按章法写代码”。
- Superpowers 适合把 coding agent 训练成一个会先写 spec、再做 TDD、再调度子代理的“工程化代理”。
- OpenSpec 适合那些不想被某个 IDE 或某个模型生态锁死的团队。
- GSD 则更进一步,它不是单纯的 spec 工具,而是在尝试解决“AI 如何长时间稳定推进复杂工程”的问题。
二、spec-workflow:最容易上手的 Claude Code 规范化入口
spec-workflow 的价值,在于它把很多开发者口头上说的“先写需求、再写设计、再拆任务、最后实现”真正变成了一个可执行流程。项目作者在仓库中写得很直接:这个工作流面向 Claude Code,核心流程就是 Requirements → Design → Tasks → Implementation,同时还额外提供针对 bug 的 Report → Analyze → Fix → Verify 路径。
它的好处非常明显。很多人第一次用 Claude Code 时,最大的问题不是模型不会写,而是太容易一上来就写。需求还没对齐,边界还没明确,AI 已经把实现堆出来了。spec-workflow 通过强制把任务拆成几个显式阶段,降低了“先写再说”的冲动,让 Claude Code 更接近一个遵循流程的工程助手,而不是一个随时开始生成代码的聊天框。
从定位上看,spec-workflow 很像“规范驱动开发的入门正交工具”。它并不试图做很重的治理平台,也没有走特别复杂的 agent orchestration 路线,而是先把最重要的结构给你搭起来:文档顺序、阶段边界、执行入口、常见 bug 路线。这也正是它为什么在 Claude Code 用户群体里传播很快——因为它足够具体,又不会一下子把门槛拉得太高。
适合场景:你主要使用 Claude Code,希望尽快摆脱“想到哪写到哪”的状态,让 AI 开始按流程理解和推进需求。
潜在局限:它的优势恰恰也来自它的边界——对 Claude Code 生态更友好,但在跨工具、跨助手场景下不如 OpenSpec 灵活;在复杂自治编排上也不如 GSD 那么激进。
三、Superpowers:把 coding agent 从“提示词响应器”升级为“工程代理”
如果说 spec-workflow 解决的是“让流程成形”,那么 Superpowers 解决的就是“让代理学会按照工程方法工作”。项目 README 把它定义为:一个建立在可组合 skills 之上的完整软件开发工作流。这句话其实非常关键,因为它说明 Superpowers 的重点不是单个命令,也不是单篇 spec,而是一套可以被代理调用、组合、复用的技能系统。
根据项目说明,Superpowers 的工作方式非常像一个受过训练的工程助手:它会先从对话里抽出 spec,让用户确认;确认后再形成实现计划,而且这个计划要足够清晰到“一个判断力差、缺乏上下文、还不爱测试的初级工程师”也能执行。之后才进入真正的实现阶段,并强调 RED/GREEN TDD、YAGNI 和 DRY,再由子代理逐步执行和审核&查验任务。
这让 Superpowers 和一般“帮我生成代码”的插件完全不是一个物种。它更像是在给 AI 编码助手植入一种工程人格:先澄清目标,再签字确认,再写实现计划,再小步快跑,再测试验证,再代码审核&查验。对于真正做产品和工程的人来说,这种方法论的价值甚至大于“单次输出质量”本身,因为它大幅降低了偏航和返工。
适合场景:你已经不满足于“AI 能不能写”,而是在意“AI 能不能像一个靠谱团队成员那样工作”。尤其适合愿意接受 TDD、代码审核&查验和子代理协作的人。
潜在局限:Superpowers 很强,但也比 spec-workflow 更依赖用户对工程流程的理解。如果你本身没有清晰的软件工程习惯,那么它带来的收益可能没有那么快显现,甚至会觉得它“太讲究了”。
四、OpenSpec:最有平台野心的轻量规范层
OpenSpec 的独特之处,在于它并不想只服务某一个模型、某一个 IDE 或某一个厂商的 coding agent。项目把自己的目标讲得很清楚:当需求只存在于聊天记录里时,AI coding assistants 虽然强大,但不可预测;OpenSpec 所做的,是在代码生成前加上一层轻量的 spec 层,让“先对齐,再开发”成为默认前提。
它最吸引人的地方,是“轻量”和“开放”。仓库里明确提到,OpenSpec 支持 20+ AI assistants,而且把自己和 Spec Kit、Kiro 等工具区分开来:它认为有些方案太重、有些方案绑定在特定 IDE 或特定模型上,而 OpenSpec 想做的是一个更轻、更通用、更容易嵌入现有工具链的规范层。
这个定位很聪明。因为到了 2026 年,很多团队最大的担忧已经不再是“有没有 AI”,而是“会不会被某个 AI 平台锁死”。如果今天用 Claude,明天试 Gemini,后天再接 Copilot 或其他代理系统,那么所有方法论都跟着平台迁移,成本会非常高。OpenSpec 的核心价值,就是尽量把“规范层”从“模型层”里剥出来,让它成为一个更持久的工程资产。
适合场景:你所在的团队工具链多样,希望规范、设计与任务文档能跨模型、跨助手、跨 IDE 延续,而不是随某个平台一起迁移。
潜在局限:正因为它强调轻量和跨平台,所以在某个单一生态里的体验,可能不如那些为特定工具深度优化的方案来得丝滑。它更像基础设施,而不是豪华内饰。
五、GSD:从“写 spec”走向“让 AI 长时间自治干活”
如果前面三个项目都还主要站在“规范驱动开发”的框架内,那么 GSD 更像是在把这件事推进到下一阶段。GSD 官方把自己定义为:一个轻量但强大的元提示、上下文工程和规范驱动开发系统,并强调它的目标是让代理能够在较长时间内自治工作,同时不丢失全局视角。
这背后的核心问题,其实是 AI 开发进入深水区后最难的一个挑战:不是单次代码输出,而是长期、多阶段、多任务、可恢复、可审计。GSD 在 README 里给出的方案非常系统化:主 orchestrator 不做重活,而是生成和调度子代理;每个阶段可以并行执行;每个任务完成后立即进行 atomic git commits;主上下文只保留较低占用,从而维持长时段运行的稳定性。它还提供了完整的命令体系,包括 new-project、plan-phase、execute-phase、verify-work、pause-work、resume-work 等。
你会发现,这已经不是简单的“帮 AI 写 spec”了,而是一整套“AI 如何像项目经理 + 研究员 + 开发者 + 审核&查验员那样分工协作”的系统。换句话说,GSD 的竞争对手并不只是其他 spec 工具,而是所有试图解决“长时代理开发”这个问题的系统。
适合场景:你要做的不只是单个 feature,而是长期推进一个中大型项目,希望 AI 能做研究、规划、执行、验证、恢复和阶段切换。
潜在局限:它的能力最强,但门槛也最高。对轻量项目来说,GSD 可能会显得过于重型;如果团队没有清晰的里程碑意识和 Git 纪律,也很难把它的优势吃满。
六、4 个项目真正的差别,不在“有没有 spec”,而在“你把 AI 当什么”
很多人第一次看这些项目时,会把它们归类成同一个标签:spec-driven development tools。但真正的分野其实不是 spec 本身,而是它们对 AI 的角色假设不同。
spec-workflow 把 AI 当作一个需要明确阶段和顺序的开发助手;Superpowers 把 AI 当作一个可以被技能体系和工程原则训练的代理工程师;OpenSpec 把 AI 当作可替换的执行层,而把规范抽象成更独立的通用资产;GSD 则把 AI 当作一个需要被精心编排、能够长期自治推进复杂工程的多代理系统。
一旦理解了这个差异,你就会明白为什么这四个项目都值得看,但并不意味着你要四个都上。它们分别回答的是不同层级的问题:
- 你是否需要先把流程结构化?看 spec-workflow。
- 你是否需要让代理更像工程师?看 Superpowers。
- 你是否需要让规范跨平台存在?看 OpenSpec。
- 你是否需要让 AI 长时间自治推进复杂项目?看 GSD。
七、如果你是不同类型的开发者,应该先看哪个?
| 你的情况 | 优先研究 | 原因 |
|---|---|---|
| 刚开始认真用 Claude Code | spec-workflow | 最容易建立规范开发习惯,学习成本低 |
| 已经能熟练用 AI 写代码,但质量不稳定 | Superpowers | 把 spec、TDD、审核&查验和子代理协作整合成方法论 |
| 团队工具链复杂,不想绑定单一平台 | OpenSpec | 轻量、跨助手、开放性更强 |
| 希望 AI 长时间推进中大型工程 | GSD | 最完整的上下文工程与自治执行路线 |
这里最重要的不是“谁最强”,而是“谁最符合你现在的问题”。很多团队会犯的错误,是一上来就追最重的系统,结果还没落地就先被复杂度压垮。对大多数开发者来说,顺序往往应该是:先把规范建立起来,再把技能体系做起来,最后才考虑长时自治编排。
八、2026 年这条路线为什么值得持续关注?
因为 AI 编程真正的瓶颈,正在从“模型智力”转向“工程控制力”。当模型已经足够会写之后,新的竞争焦点就变成了:谁能更好地锁定需求、维持上下文、组织阶段、隔离任务、控制回滚、沉淀规范。换句话说,未来决定开发效率上限的,不只是模型参数和推理能力,而是工作流设计。
从这个角度看,spec-workflow、Superpowers、OpenSpec 和 GSD 的意义都不仅仅是几个 GitHub 热门项目。它们实际上是在不同方向上试探同一件事:AI 编程能不能从“对话生成代码”升级为“按工程体系持续交付软件”。
这也解释了为什么最近越来越多开发者开始把“spec-driven development”“context engineering”“subagents”“atomic commits”这些概念放到一起讨论。因为它们已经不再是孤立技巧,而是在逐步拼成下一代 AI 软件开发的底层范式。
结语
如果你想给这四个项目一个最精炼的定位,可以这样记:
spec-workflow 是规范入口,Superpowers 是工程方法,OpenSpec 是开放规范层,GSD 是自治执行系统。
它们不是互相替代的关系,而更像是 2026 年 AI 编程工作流进化路径上的四个关键坐标。对普通开发者来说,最值得做的不是一口气把所有框架都装上,而是先判断自己最缺的到底是“流程”“方法”“开放性”还是“自治能力”。
一旦这个问题想清楚,你再看这些项目,就不会只是觉得它们“都挺厉害”,而是会真正知道:哪个能帮你把 AI 从一个会写代码的工具,变成一个能持续交付的软件协作者。
项目地址
| 项目 | GitHub |
|---|---|
| spec-workflow | https://github.com/anthropics/spec-workflow |
| Superpowers | https://github.com/superpowers-ai/superpowers |
| OpenSpec | https://github.com/openspec-ai/openspec |
| GSD | https://github.com/gsd-dev/gsd |


评论