Conntour 获 700 万美元融资,打造安监视频 AI 搜索引擎

内容管家 AI领域评论0字数 1053阅读3分30秒阅读模式
Conntour 获 700 万美元融资,打造安监视频 AI 搜索引擎

监控技术行业正站在舆论的风口浪尖。美国的移民执法机构 ICE 接入 Flock 摄像头网络进行大规模监控,家庭摄像头厂商 Ring 因与执法部门共享画面功能而引发争议——这些事件让安全、隐私与监控边界成为全社会的热议话题。

然而,争议并不能阻止市场扩张。随着视觉-语言模型(vision-language models)的快速发展,一批新兴公司正在用 AI 技术重新定义视频监控的边界。成立于约两年前的视频监控初创公司 Conntour 正是其中之一。

选择客户的底气:大客户背书

Conntour 联合创始人兼 CEO Matan Goldner 在接受 TechCrunch 独家采访时坦言,公司在客户筛选上极为审慎:"我们有大客户作为背书,这让我们能够主动选择合作方、掌控使用场景。我们只接那些我们认为道德且合法的需求。" 值得注意的是,Conntour 的客户群中包括新加坡中央肃毒局(Central Narcotics Bureau)这样的zf 机构。这种"挑剔"策略对于一家成立仅两年的初创公司而言并不常见,但 Goldner 认为这恰恰是公司能够良性运转的基础。

这一市场验证也直接推动了融资进展。Conntour 近期完成了 700 万美元种子轮融资,投资方包括 General Catalyst、Y Combinator、SV Angel 和 Liquid 2 Ventures。Goldner 透露,整个融资周期仅用 72 小时便宣告关闭。

核心能力:自然语言搜索监控画面

Conntour 的视频平台允许安保人员直接用自然语言查询摄像头画面,实时定位任意物体、人员或事件——相当于专为安防视频打造的 Google 搜索。与传统系统依赖预设规则和固定参数不同,Conntour 基于视觉-语言模型,具备更高的灵活性和易用性。

用户可以提出类似这样的问题:"找出穿运动鞋的人在大厅递包的所有画面",系统会在录像或实时画面中快速检索并返回结果。由于内置 AI 模型,用户还能直接向画面提问、获取文字回答、配套视频片段,并自动生成事件报告。

[[SFIMG0]]

扩展性:50 路视频仅需一块 RTX 4090

Goldner 强调,Conntour 与其他 AI 视频搜索服务最大的差异在于扩展性。系统设计之初便面向大规模部署场景,可高效管理数千路摄像头信号。更关键的是,Conntour 声称其系统只需一块消费级 GPU(如英伟达 RTX 4090)即可同时处理 50 路摄像头信号。

实现这一效率的技术路径是:系统内运行多套模型和逻辑引擎,针对每次查询自动选择计算资源消耗最低、同时能给出最优结果的模型组合。

在部署方式上,Conntour 支持完全本地化、完全云端或混合部署模式,可接入大多数现有安防系统,也可作为独立监控平台使用。

行业难题与未来方向

视频监控行业长期存在一个根本性问题:画面质量决定监控效果的上限。光线不足的停车场、低分辨率镜头或脏污的摄像头都会严重影响识别准确率。Conntour 的应对策略是为每条搜索结果附带置信度评分,当信号源质量不达标时,系统会标注较低的置信水平。

谈及未来技术路线,Goldner 指出了最核心的矛盾:"我们同时要做两件相互矛盾的事——一方面要提供完整的自然语言灵活性和 LLM 级体验,另一方面要保持低资源消耗。处理成千上万路视频流的计算量是惊人的。这个矛盾是我们面临的最大技术壁垒,也是我们投入最多的攻坚方向。" [[SFIMG1]]

延伸阅读

 
内容管家

发表评论