
"递归"成 AI 圈新热词:自我改进系统从概念走向军备竞赛
"递归"(Recursion)正在成为 AI 圈最新的热门词汇。两家初创公司不约而同以此为名,更有大量团队开始在路线图中引入"递归式自我改进"(RSI)概念。与几年前的 AGI 一样,RSI 已成为某种 AI 突变式飞跃的代名词——尽管人们对它的精确定义仍存在分歧。
RSI 是什么?自我升级的封闭循环
简而言之,RSI 指一个能够持续自我升级的 AI 系统。一旦 AI 在管理升级周期上超越人类,整个过程即可形成闭环,唯一的限制因素变为可访问的算力规模——届时人类既不必要,甚至可能帮不上忙。
无论听起来是否令人不安,这正是众多 AI 实验室竞相追逐的愿景。
玩家阵容:大厂出身的 AI 老将纷纷押注
Richard Socher 作为知名 AI 研究者,本月初推出了以"递归超级智能"命名的同名公司,将 RSI 定为核心目标。"我们的主要方向是在规模层面构建真正递归、自我改进的超级智能,"他在发布时接受 TechCrunch 采访时表示,"这意味着研究想法的构思、实施和验证,整个流程都将自动化。" Alex Karpathy(特斯拉与 OpenAI 传奇人物)选择了另一条路:利用 Agent 集群在简单任务上训练 LLM,项目名为 Auto-Research。Karpathy 对此出奇开放,定期在 X 上发布里程碑动态,核心代码也已在 GitHub 公开发布。目前工作主要局限于在 GPT-2 规模模型上做小幅改进——正如他在今年三月所说,"还不是真正意义上的创新性'研究'(目前)。"但这已足以吸引大量研究者追随 RSI 梦想。如今 Karpathy 已在 Anthropic 从事预训练工作,未来有机会在更大规模上验证这一思路。
Adaption 由 Cohere 和 Google 前员工 Sara Hooker 创立,近期推出了类似工具 AutoScientist,旨在自动化前沿训练。与 Karpathy 的路径相似,系统通过训练 Agent 做渐进式改进——但 Adaption 的目标是降低全规模前沿模型的训练门槛。一旦这些研究者开始推动前沿边界,整套系统可能迅速演变为类 RSI 形态。
Disarray 创始人 Doris Xin 引发了更具体的 RSI 关注:她自研的机器学习 Agent 在近期 Kaggle 竞赛中斩获 28 枚奖牌,击败了大量人类训练的 Agent。她认为,核心挑战在于可靠性: "我会说,如果有无限算力和无限时间线,我们已经做到了," Xin 表示。"我想论证的是,这本质上不是创造性工作,而是大量扎实的工程问题。"
现实检验:AI 行业离 RSI 还有多远?
也有大量证据表明,AI 行业在任何有意义的递归系统上都还相距甚远——乃至如何向持警惕态度的公众解释进展,都是一道难题。Google CEO Sundar Pichai 在近期播客访谈中基本承认了这一点。
"这是一个连续体,我们确实都在取得进展," Pichai 表示。"但人们所描述的 RSI,代表着一种加速度的跃升,会有大量影响——我们还没有到那一步。" 不过,这条连续体上也充斥着大量自我改进型 AI 系统。今年一月,Anthropic 负责 Claude Code 的首席工程师估算,其团队"接近 100%"的代码由该工具编写——这相当于坦承 Claude Code 正在自我编写。
工程师使用 AI 工具,并不意味着 AI 能取代工程师——但 Anthropic 似乎正在接近取代工程师本身。在与 Mythos 预览版相关的一份调查中,18 位 Anthropic 工程师里有 5 位认为:配合工具链改进,Mythos 很快就能替代 L4 工程师——即能够独立承接复杂项目的中级程序员。
但报告同样揭示了预期中的短板: "Claude 与 L4 相比的主要弱项包括:自我管理周期为一周的模糊任务、理解组织优先级、品味、验证、指令跟随和认知论。" 换言之,它的短板恰恰集中在自我主导能力——而这正是 RSI 的基石。但除此之外,Claude 已经准备好随时顶上。
与 AGI 的情况如出一辙,AI 行业也无法给出距展示有意义的递归系统还有多远的清晰答案。去年乔治城大学安全与新兴技术中心召集专家小组对 RSI 展开研究时,发现评估存在巨大分歧——有人预期即将出现"超级智能"式爆发,也有人预计进展放缓并最终趋于平稳。但各方一致认同:递归让未来格外难以预测。
CSET 主任、前 OpenAI 董事会成员 Helen Toner 指出,仅用 AI 工具来做 AI 研究并不足以称之为 RSI。"他们只是在尽可能多地使用 AI,"她对 TechCrunch 表示。"我认为这与 RSI 的经典定义不同——经典定义是真正不再需要人类。"
AI 研究自动化的三个阶段
METR 的 Ayeja Cotra 在一篇博客文章中提出了 AI 研究接管路径的里程碑模型,将这一过程分为三个层级:
- Adequacy(达标):即使移除所有人类,系统仍能继续从事研究——尽管产出价值或效率不如人类团队
- Parity(对等):纯 AI 系统在研究能力上与纯人类团队持平
- Supremacy(超越):纯 AI 系统超越人类与 AI 协作系统
Cotra 认为,AI 已非常接近"Adequacy"门槛——即能独立产出部分研究成果,类似于 Karpathy 的 Auto-Research 系统所实现的增量进步。她写道:"如果你告诉我这个里程碑已经到来,我不会完全惊讶;我预计它会在未来几年内发生。" 至于 Parity 何时到来尚不明朗,但 Cotra 预言,一旦达到该节点,将"大幅加速 AI 进展,在一年内推动 AI 研究达到 Supremacy"。
发展路上的磕绊
当前 AI 发展高度依赖 scaling laws(缩放定律),这让许多从业者倾向于认为 RSI(递归自我改进) 会沿着同样的曲线演进。Toner 指出,很多正在推进 AI 研究与开发的人"把它想象成一把平滑的梯子,只需要不断放大规模。" 然而,即便 AI 研究者能够像 Karpathy 的自动研究团队那样实现增量改进,在将整个研究流程交托给机器时仍将面临更大挑战。Toner 以计算发展史为参照——人类虽然在流程中不断下放更多职责,但始终在顶层保持掌控:
"我们从机器语言到汇编语言,再到编译语言;你离计算机的内核越来越远。但人类仍然以某种直觉的方式掌控着整个过程。"
突破这一范式需要在工程和对齐两方面克服重大挑战。此外,即使当前投入巨大,计算资源并非无限——人类劳动与机器智能之间的基本取舍也难以完全消除。
至于那种末日图景中的完全递归 AI 系统,研究者唯一达成的共识是:它尚未到来——与 AGI 类似,RSI 的终极形态仍是遥远的目标。


评论