Snowflake 工程团队大规模落地编程智能体的方法论

2026年7月2日内容管家

AI领域评论0字数 3582阅读11分56秒阅读模式

在 2025 年 Snowflake Summit 期间，Stack Overflow 播客栏目 Leaders of Code 对 Snowflake 工程高级副总裁 Vivek Raghunathan 进行了深度访谈。Vivek 首次系统披露了 Snowflake 过去 12 至 18 个月在工程团队中推广编程智能体的完整路径——从"允许混乱"的无限制实验阶段，逐步收敛出一套包含 14 种 AI 设计模式 的共享词汇表。

以下为核心内容摘要。

从混乱到秩序：分阶段推进策略

Vivek 引用 Andy Grove 的名言——"任何平台转型期，都要先让混乱蔓延，再收拾残局"——来概括 Snowflake 的初始策略。

在第一阶段，工程团队完全自由地尝试各类编程智能体工具，不设任何量化考核。Vivek 明确表示："我们不统计代码行数，不统计 PR 数量，不统计任何容易被操纵的指标。唯一关心的指标是——你每周至少使用两次吗？" 结果显示，95% 的工程师每周至少使用两次，采用率迅速攀升。

进入第二阶段后，团队开始将验证有效的方法论编码为共享设计模式，形成 14 种 AI 设计模式的内部标准库。这些模式覆盖了从"用英文规划"（plan-in-English）到"隔离并行智能体"再到"通过持续更新的技能库降低值班负担"等多种场景。

软件开发的内外循环与 Yegge 量表

Vivek 将软件开发分解为三层循环：

内循环（Inner Loop）：代码在工程师脑海中构思，随后在本地工作站或云端工作区完成编写与调试。
第一外循环（Outer Loop）：代码合并至主分支后，需要经历发布流程进入生产环境。
第二外循环（第二 Outer Loop）：生产环境中发现的 Bug 以支持工单或事故单的形式反馈回开发侧，修复方案再流回主分支。

为衡量工程师在各循环中的进展程度，Snowflake 内部引入了一套 Yegge 量表（类似 Hacker News 创始人 Paul Yegge 早年提出的工程师能力评估框架），用于追踪团队在智能体辅助下的成长轨迹。

落地成效：三个关键指标

编译器优化：3 人团队实现 40 倍性能提升

一个仅 3 名工程师组成的小团队，借助编程智能体对 Snowflake 的查询编译器进行优化，最终实现了 40 倍的性能改进。

发布验证周期：15 天压缩至 1 天

此前一次发布验证周期需要 15 天，引入智能体辅助后已缩短至仅 1 天。Vivek 强调，自动化测试覆盖率大幅提升的同时，生产稳定性并未受到影响。

值班运维：四步成熟度模型

Vivek 还预告了 Snowflake 正在规划中的值班与事故响应四步成熟度模型，其中第四阶段的目标是让智能体承担主要值班职责。

团队分层与焦点周机制

Pioneers / Settlers / Skeptics 框架

Snowflake 将工程师对 AI 工具的接受度分为三类：先锋（Pioneers）、定居者（Settlers）和怀疑者（Skeptics），并针对不同阶段提供差异化的支持策略。Vivek 坦言，AI 工具的采用曲线会触发类似于"悲伤五阶段"的心理反应，团队需要正视这一现实。

Focus Weeks 机制

每隔一段时间，Snowflake 会设立Focus Week（焦点周），给工程师留出整块时间：既可以用于追赶最新最佳实践，也可以深入推进前沿探索。

本段来源：LinkedIn - Vivek Raghunathan

编程代理的 14 个设计模式

在 GitHub，95% 的工程师每周至少使用一次编程代理，而 97% 的工程师属于活跃用户。但真正的差距在于：是每天节省 20 分钟，还是让 AI 完成 80% 的工作。

Vivek Raghunathan 认为，掌握编程代理的关键在于 14 个 AI 设计模式——这个词他刻意选用了软件行业"Gang of Four"设计模式的概念来形容。这套模式是 GitHub 最前沿的"AI 先锋"们在实践中发现的最佳使用方式，已经整理成 XKCD 风格的图解，方便团队内部快速传播。

几个典型模式示例

Pattern 1：Plan in English（先用英语做计划）

开启编程代理的"计划模式"，先用 Markdown 写出行动方案，再生成代码，而非直接让 AI 写代码。

Pattern 4：Fence your Robots（圈住你的机器人）

单个代理速度慢、多个代理并行又容易产生混乱。可借助 git-worktree 让各代理独立运行、互不干扰，从而大幅提升工程效率。

Pattern 8：TLA/TLF Agents（任务编排代理）

与用户对话的"主代理"不应承载过多上下文，而是将工作委托给子代理团队处理，使主代理的大脑始终保持空闲，能够专注沟通协调。

Pattern 11/12/13：持续学习模式

将对话中的临时经验沉淀为"技能"（Skills），过夜后系统自动优化；若团队全员参与，还能形成组织级的知识积累。

Focus Week：用一周时间统一升级

有了这套模式语言，GitHub 进入第三阶段——"收服混乱"（Reign in the Chaos）。最有效的手段是一个看似简单的动作：创建专门的时间和空间，他们称之为"Focus Week"。全公司用一周时间暂停日常工作，专门用来探索和学习。

这一周同时服务两类人：

95% 的"利用者"（Exploiters）：只想知道最佳路径、直接拿来用，不愿花时间深入学习。Focus Week 给了他们"追赶"的时间。
5% 的"无畏探索者"（Fearless Explorers）：已经在自发研究，甚至周末和晚上都在用。他们需要的是专注探索的时间，而非更多指导。

实际效果

推行这套方法后，GitHub 的核心指标全面提升：

代码产出同比增长约 1.5 倍，近三年累计增长约 3 倍
代码合并时间缩短
代码审核&查验速度加快——团队像乐队即兴合奏一样高效协作

Vivek 将此称为"抬高地板、抬高天花板"（Raising the floor, raising the bar）：让普通工程师快速上手，让顶尖工程师持续突破。

发布周期压缩 85%：AI 重塑代码交付外环

Vivek Raghunathan 将 AI 在工程外环的应用归纳为三个核心问题：能否更快更好地发布代码？能否更深度地测试？能否更智能地调试？ 对于企业级客户而言，这三个问题尤为重要。Vivek 指出："我们的客户不是消费类初创公司，他们对发布时间有明确预期，不接受任何缺陷进入生产环境。"

从 15 天到 1 天：发布验证效率的跃升

一年前，单次完整发布的验证周期长达 15 天。Snowflake 团队执行极为严苛的验证流程：

每次发布运行数十万量级的任务
重复执行全部性能基准测试
将客户提交的单个查询纳入回归基准
覆盖率接近 90%

经过一年的改进，验证时间已压缩至 1 天——压缩幅度达 93%。背后的驱动因素包括更成熟的工具、更严格的工程纪律，以及 AI 编码代理的引入。

当发现阻断性问题时，AI 会自动诊断根因，甚至在 GitHub 上创建 PR，再由负责人审核确认。这种机制让团队得以在保障质量的前提下实现高频发布。

测试驱动开发「重生」：用例数翻三倍

在测试环节，团队采用了一种新型测试驱动开发（TDD）模式：

先用 AI 编码代理为功能编写测试用例，再编写实现代码。

这一思路与十几年前的 TDD 一脉相承，但借助 LLM 的能力，测试编写门槛大幅降低。团队整体测试用例数量提升了 3 倍，而同期发布频率也在加快。

Vivek 强调，更快的发布节奏并未导致质量下滑——生产环境中的 SK 热修复补丁数量显著减少，发布安全性反而更高。

运营知识资产化：从「部落知识」到可复用技能

Snowflake 目前有约 1000 名工程师编写了近 7000 个技能（Skills）。Vivek 认为，AI 彻底改变了运维的生命周期：

将散落在工程师脑海中的运维经验（"这个告警触发时就这样处理"）编码为可版本化的 CI/CD 工作流
打包成「Profile」单元，例如「流媒体问题排查」对应一组特定技能
每个客户问题自动关联「爆炸半径技能」，快速定位受影响范围

告警处理的四阶段成熟度模型

Vivek 分享了团队使用生产编码代理的演进路径：

编写技能：将历史问题处理经验全部编码为 AI 可调用的技能
事件驱动 AI：对接 PagerDuty 或 Slack，实现告警自动触发
多步推理工作流：由 LLM 编排跨系统操作——调用支持、与客户协作、跨部门协调
持续学习：将每次事件调查中新发现的知识回写至技能库

KTLO 降低七成：让 on-call 不再是噩梦

KTLO（Keep The Lights On）运维负担目前已减少约 30%，Vivek 的目标是降至 5%。长期愿景是将 AI 代理设为主值班人，人类工程师负责二、三线支持。

这并非空谈。Vivek 的团队中已有明确的路径规划：未来工程师会对 on-call 感到兴奋，而非恐惧——"我期待处理告警，因为它很有趣"，而不是"每九周才轮一次，因为那是本季度最痛苦的一周"。

工程师的转型岔路口：三种人，一条 continuum

Vivek Raghunathan 认为，每一次大的技术转型，人群大致可以分为三类：

Pioneers（先锋）：主动探索，像 Lewis 和 Clark 一样去未知领域开路。
Settlers（定居者）：跟随先锋搭建基础设施、形成规模。
Skeptics / Resistors（怀疑者）：不一定是故意抵制，很多是隐性的不情愿。

当 AI 编码能力已经与资深工程师水平相当甚至更强时，相当多人正在经历他所说的"七阶段心理过程"——类似于 grieving（心理接受过程）。领导者的职责是走到每一类人所在的地方，而不是一刀切地推全员上手。

领导者现在该做什么

Vivek 直言：这个时刻，领导者必须"lead from the front"（冲在前面），而不是躲在后方指挥。具体来说：

先处理自己的情绪，确保自己已经是 pioneer 状态。
亲自示范 AI 工具如何融入工作流。
带团队一起走，而不是等他们自己顿悟。

谁是真正的先锋

识别先锋其实很容易：他们对 AI 工具的热情是自发的，甚至周末都在用，迫不及待要找人分享。但值得注意的是，这批人和过去意义上的"10倍工程师"完全不同——真正被放大的是好奇心、适应力和学习意愿，而非传统的手写代码能力。

Vivek 还在内部引入了"Yegge 量表"（以 Steve Yegge 命名）来量化团队的 AI 采纳成熟度。他的目标是将组织内 Yegge 7 级的人才数量翻 5 倍，路径是把 Yegge 3 级的人一步步带上去——而不是靠招聘解决。

Snowflake 编译器改造：40 倍加速的背后

Vivek 分享了一个具体案例。Snowflake 的查询引擎编译器是整个产品最核心、最难动的部分，Iceberg 支持、Dynamic Tables、Unistore 这些大功能都沉淀于此。传统方式下，编译器工作既慢又需要高度小心——这对交互式短查询影响尤其大，因为编译时间可能占到总耗时的相当比例。

负责这项工作的技术负责人只带了3名领域专家工程师 + 一组 AI 编码智能体，在极短时间内完成了编译器重写。实测结果：性能提升 40 倍。

当然，Vivek 也承认，能有这个结果，关键在于人本身是领域专家——他们清楚系统里"果汁在哪里"（where the juice is）。AI 放大了人的判断力，而不是替代它。

编程代理让"野心勃勃"变得触手可及

在 Snowflake 2024 峰会的访谈中，Vivek Raghunathan 分享了一个观点：过去许多客户的需求对技术团队来说遥不可及——客户曾说"如果你们能实现这个功能，我明天就把整个工作负载迁过来"，而 Snowflake 的工程团队往往要花数年时间才能达到那个水平，差距甚至高达 3 倍。

但编程代理改变了一切。

"一瞬间，我们做到了。"Vivek Raghunathan 表示，"编程代理让雄心勃勃的目标变得真正可以实现。你可以有无限的野心。"他回忆称，在 Google 时期，拉里·佩奇常挂在嘴边的一句话是："瞄准月亮。"因为越难的问题，愿意去解决的人越少，反而拥有更大的施展空间。

Cortex Sense 这款产品就是典型案例——它源于一位工程师在圣诞假期自己动手写了一套自动化语义模型的系统，边做边发现："这东西有意思，值得深挖。"从个人 hack 到正式产品，功能本身没有改变，但边界已被彻底打破。

Snowflake 将此总结为公司的双重使命：AI 让数据跑得更快，数据让 AI 跑得更快。两者形成正向循环，最终为客户创造实际价值。Vivek Raghunathan 本人也坦言，这正是他每天早上醒来最兴奋的事。