General Intuition 融资 23 亿美元,用游戏训练 AI 控制机器人

内容管家 AI领域评论0字数 2285阅读7分37秒阅读模式
General Intuition 融资 23 亿美元,用游戏训练 AI 控制机器人

通用人工智能新星崛起:200 小时不间断游戏背后,藏着怎样的野心?

同一套大脑,同时驾驭虚拟与现实

走进 General Intuition 位于纽约办公室的研发层,联合创始人兼 CEO Pim de Witte 首先把我引向一块挂在升降桌上的显示器——屏幕里有人正在玩类似《堡垒之夜》的游戏。不对,那不是人。

"我们的 AI Agent 已经连续跑了 100 个小时了,"公司首席产品官 Kent Rollins 笑着说。

还没等我从 AI 在虚拟世界中自主探索的奇观中回过神,一只大型四足机器人的电子脚步声已经由远及近。

"驱动游戏里那个 Agent 的,是同一套大脑,"de Witte 告诉我。

数据分析师 Josh Duplantis 端着笔记本电脑,屏幕上正实时传输着机器人唯一的摄像头画面。他补充说,这台机器人的默认模式是"探索"。

依靠那台摄像头——它唯一的"眼睛",这台形似巨型昆虫的四足机器人走近我,绕了一圈,然后继续向办公室深处走去。它偶尔会磕到椅腿,或者撞上某个被随手丢在地上的垃圾桶,活像一个还没学会感知自己身体与周围空间关系的小孩。Duplantis 说,他们仅用了 8 分钟的真实机器人数据 就完成了模型微调——而这些数据采集于街道上,并非机器人正在自主行走的这间办公室。

从游戏数据到具身智能:一条护城河

能将在游戏中学到的能力泛化到仿真环境、再迁移到实体机器人身上,这就是 General Intuition 存在的核心理由。这家公司的模型展现出对"自身在世界中位置"的强大理解能力,也因此获得了重磅投资方的支持。

本周四,General Intuition 宣布完成 3.2 亿美元融资,估值达 23 亿美元,印证了 TechCrunch 此前的一些报道。此轮过后,公司累计披露融资额已达 4.54 亿美元(上一轮是去年 10 月启动时的 1.34 亿美元)。

这家创业公司是从 de Witte 另一家公司 Medal 中分拆出来的——Medal 是一个让玩家上传和分享游戏视频片段的平台。平台积累的数亿小时游戏上传记录,为 General Intuition 的模型提供了在时空推理(理解如何在空间与时间中移动)方面的初始训练数据。

但关键并不只是游戏画面本身,而是这些视频片段中嵌入的动作标签:即玩家具体在什么时间按下了什么按键。de Witte 表示,大多数竞争对手试图仅从视频中推断动作,在他看来这远远不够。

"我们把这视为下一代预训练的必经阶段,"de Witte 说,"我们有一个统一模型,既能响应屏幕上《堡垒之夜》的信息并作出操作,也能应对现实世界的动态——这是 LLM 完全做不到的。" 在某次演示中,de Witte 给我在一台笔记本上启动了 General Intuition 的世界模型——这是一个逐帧生成的仿真环境,而非传统游戏引擎渲染的那种。我和往常测试世界模型时一样,直接往蔷上撞——在其他演示里,你控制的 Agent 有时会穿蔷而过,但这个不会。从数百万小时的游戏数据中,它不知怎么学会了:蔷就是蔷,梯子是用来攀爬的,阳光移动时影子会拉长。

对 General Intuition 而言,世界模型不是产品,而是训练环境(内部称之为"健身房")。公司的最终目标是销售这套 Agent 模型,de Witte 认为游戏数据中嵌入的动作标签能帮助模型区分"自我"与"环境",从而获得更丰富的因果理解。

重磅投资方阵容:中国资本缺席,美国大佬云集

虽然 General Intuition 的技术在演示中令人印象深刻,但它并非唯一试图解决这个问题的公司。更重要的是,在物理世界中大规模部署这类模型,尚未有人真正做到。大多数同类方案需要海量真实数据,而这些数据采集缓慢且成本高昂。General Intuition 的赌注是:游戏是一条可扩展的捷径。

投资方也认可这个赌注。此轮融资由 Khosla Ventures 领投,其他参与者包括 General Catalyst、Jeff Bezos、Eric Schmidt、Nico Rosberg,以及 Google DeepMind 和 MIT 的研究人员。

大部分资金将用于扩大算力基础设施。General Intuition 已与 CoreWeave 达成合作,计划专注预训练下一版模型。另一部分资金则用于在夏末前将 API 开放更广泛地接入。

Khosla 本人在电话采访中说,de Witte 的愿景和公司独特的数据资产是他下注的原因: "如果你回顾 LLM 的发展,推理能力出现时是一次量子跃迁。在世界模型领域,我认为下一次量子跃迁是 AI 中'直觉'的出现——一种类似人类直觉的能力。游戏中的人类动作数据和反应数据,是直觉涌现的关键所在。"

人道主义背景创始人的边界:不做致命自主武器

这轮融资的部分底气,也来自对 de Witte 本人的信任。这位创业者曾在人道主义领域工作三年,其中包括无国界医生组织。因此他为 General Intuition 的技术划定了明确的使用红线:不允许将 Agent 用于伤害人类

"我们不想成为系统中一个升级对抗的环节,"de Witte 说,"假设我站出来说'我们做致命自主武器',你觉得其他国家会作何反应?"

通用直觉:一家不做军事生意的欧洲 AI 初创

与很多硅谷公司的立场不同,通用直觉明确限制了军事用途。但 de Witte 表示,他并不反对将模型用于搜救等场景。

欧洲团队基因与人事选择

de Witte 是荷兰人,团队大部分成员也来自欧洲,这塑造了公司的独特气质。他聘请 Martin 的原因之一,是她公开退出 Palantir——因为该公司承接了美国移民与海关执法局(ICE)的项目。

"硅谷为什么做那些事,我不太理解,"de Witte 说,"这就是我不在那里的原因。"

从游戏玩家到 AI 伦理实践者

de Witte 的伦理观不仅限于划定红线。作为一名资深游戏玩家,他在青少年时期通过搭建和托管私人 RuneScape 服务器赚了 150 万美元,这也让他更关注那些可能被 AI 替代的人将何去何从。

通用直觉近期推出了一个名为 Nerve 的平台,本质上是一个任务市场,让玩家利用现有设备赚取收入。注册用户从数据标注起步,逐步可以过渡到机器人遥操作等任务。de Witte 指出,Medal 的用户群体恰恰是最容易受到 AI 冲击的那一代人,他希望让他们在这场变革中拥有一席之地。

成为生态基础设施

de Witte 的目标是让通用直觉像 Anthropic 或 OpenAI 那样,成为生态系统的赋能者——提供模型,让其他人在其技术之上构建应用。目前公司已在游戏、仿真和机器人领域拥有少量客户。

"我们不会去造一家自动驾驶公司,"de Witte 说,"我们要让下一个人建造自动驾驶公司的难度降低 10 倍。" 公司计划通过 API 接触更多客户,在各种场景中验证实力——包括在工厂数字孪生中测试机器人、为游戏工作室驱动类人 bot,或派四足机器人进入危险环境作业。尽管四足机器人是通用直觉在现实世界尝试的第一种物理形态,但公司也测试过无人机等设备,甚至在赛车游戏中跑过模型。

"任何可以用游戏手柄或键鼠控制的东西,我们的模型都能适配,"de Witte 表示。

数据飞轮是核心目标之一。de Witte 介绍,公司会优先选择能提供真实世界数据的客户,以推动基础模型的研究进步——尤其是那些拥有敏捷内部团队、可以深度合作的伙伴。

Khosla 则指出,通用直觉的专有数据是支撑其走到今天的关键,未来能否持续积累独家数据将至关重要。尽管演示效果令人印象深刻,但仿真到真实世界的迁移能否规模化,仍然是悬而未决的问题。

  • Rebecca Bellan,TechCrunch

 
内容管家

发表评论