
Nomadic AI 获 840 万美元种子轮融资:用视觉语言模型解锁自动驾驶视频数据标注难题
自动驾驶车队每天产生的视频数据量惊人——少则数千小时,多则上百万小时。如何高效地从这些素材中筛选出有价值的信息?一家名为 Nomadic AI 的初创公司正试图解决这个痛点。
痛点:95% 的车队数据在归档睡大觉
开发自动驾驶汽车、工业机器人或自主施工设备的企业,往往积累了海量视频素材。这些素材既是模型训练的基础,也是合规审计的依据。然而,整理和标注这些视频至今仍依赖人工——即便快进播放,也无法规模化应对。
更棘手的是边缘场景(edge case):这类数据恰恰最有价值,但事件本身稀少,极易让经验不足的物理 AI 模型产生困惑。
Nomadic AI 联合创始人兼 CEO Mustafa Bal 此前在 Lyft 任职,CTO Varun Krishnan 则来自 Snowflake。两人在哈佛计算机系本科期间相识,此后在各自工作中"反复遇到同样的技术挑战"。他们告诉 TechCrunch,Nomadic 的核心使命是帮助客户激活那 95% 沉睡在归档中的车队数据。
产品:把原始视频转化为可搜索的结构化数据集
Nomadic AI 的平台通过一组视觉语言模型(Vision Language Models),将原始视频素材自动转化为结构化、可搜索的数据集。由此一来,企业既能实现更精细的车队监控,也能快速构建用于强化学习的专属数据集,从而加速迭代。
一个典型应用场景是:假设需要微调自动驾驶系统对"交警指挥交通时闯红灯"的理解,或筛选出所有车辆通过某一特定桥梁的片段——过去需要人工逐帧查找,如今在平台上输入描述即可定位。
联合创始人 Varun 强调,Nomadic 不只是标注工具,本质上是一个"代理推理系统(agentic reasoning system):你描述需要什么,它自动推理出如何去找",调用多个模型协同理解画面中的行为并还原上下文。
当前付费客户已包括 Zoox、Mitsubishi Electric、Natix Network 以及 Zendar。Zendar 工程副总裁 Antonio Puglielli 表示,Nomadic 的工具让公司得以比外包方案更快地扩大规模,其领域专业知识也是区别于竞品的关键。
融资与竞争:840 万美元种子轮,挑战 Scale、Kognic、Encord
本周二,Nomadic AI 宣布完成 840 万美元种子轮融资,投后估值达 5000 万美元。本轮由 TQ Ventures 领投,Pear VC 与 Google 前首席科学家 Jeff Dean 参投。上个月,公司还在 Nvidia GTC 创企路演大赛中荣获一等奖。
这笔资金将用于扩大客户规模并持续迭代平台。
在物理 AI 数据标注赛道,Nomadic 面临来自传统数据标注公司的竞争。Scale、Kognic、Encord 等企业均在开发 AI 辅助标注工具;Nvidia 也推出了开源视觉语言模型系列 Albamayo,供企业自行适配。TQ Ventures 合伙人 Schuster Tanger 评论道:
"Salesforce 不会自建云,Netflix 也不会自建内容分发设施。自动驾驶公司一旦试图内部自建 Nomadic,就等于从它们真正该专注的事——机器人本身——上分心。"
Tanger 还特别提到 CTO Varun Krishnan 是一位国际象棋大师,实时排名世界第 1549 位;公司约十名工程师全部发表过学术论文。
下一站:LiDAR 传感器与非视觉数据
Nomadic 目前的产品主要处理视频画面,但团队已在开发专项工具:一款能通过摄像头素材理解变道物理规律的工具,另一款可从视频中推导机器人夹爪的精确位置。
接下来的方向是将能力扩展到非视觉数据(如 LiDAR 传感器读数),并实现多模态传感器数据的融合。
Mustafa Bal 坦言:"搬运 TB 级视频数据,将其与数百个千亿参数模型碰撞,再从中提取精准洞察——这件事的难度确实超乎想象。"


评论