DeepL 语音翻译套件上线,支持会议与群聊

内容管家 AI领域评论0字数 576阅读1分55秒阅读模式
DeepL 语音翻译套件上线,支持会议与群聊

DeepL 正式推出实时语音翻译套件,覆盖会议、移动端与网页对话、前线员工协作等场景,并开放 API 供第三方构建定制化应用。

为什么 DeepL 选择切入语音翻译

DeepL CEO Jarek Kutylowski 在接受 TechCrunch 采访时表示:"在文本翻译领域深耕多年后,语音是水到渠成的一步。文档翻译我们做得不错,但实时语音翻译一直没有真正的好产品。" 语音翻译的核心挑战在于延迟与准确率之间的平衡——用户说话后,译文音频需要尽快播放,但过度的速度压缩又会影响翻译质量。

三大产品形态

会议场景:提供 Zoom 和 Microsoft Teams 插件,与会者可以实时听到他人发言的翻译音频,或在屏幕上查看实时翻译字幕。目前处于早期访问阶段,DeepL 开放了组织候补名单申请

移动端与网页对话:支持面对面或远程的一对一及多人语音交流。

小组协作:通过二维码邀请参与者加入,适用于培训、工作坊等场景。

此外,系统支持学习自定义词汇,包括行业术语、公司名称和人名等。

技术架构与未来方向

DeepL 强调整条技术栈均为自研。目前的实现路径为:语音→文字→翻译→语音。DeepL 认为,凭借多年文本翻译积累,其翻译质量具备竞争优势。未来计划开发端到端语音翻译模型,彻底跳过文字中间层。

在企业应用层面,Kutylowski 认为 AI 将重塑客户服务形态——翻译层可帮助企业在缺乏合格本地语人才的地区提供支持。

竞争对手概览

  • Sanas:2024 年获 Quadrille Capital 和 Teleperformance 6500 万美元融资,专注实时口音转换,主要面向呼叫中心。
  • Camb.AI:总部位于迪拜,面向媒体娱乐公司的语音合成与翻译,支持大规模视频配音本地化。
  • Palabra:由 Reddit 联合创始人 Alexis Ohanian 创立的 Seven Seven Six 投资,定位实时语音翻译,保留原始说话人音色。

延伸阅读

 
内容管家

发表评论