
库特洛夫斯基指出,打造及时翻译产品的核心难点在于如安在降低延迟和保持精确性之间取得均衡。 所谓延迟,是指从用户开口措辞到译文语音播放之间的时光差,在会议和对话场景中,这一差值越小,用户的交换体验就越接近“同声对话”。
DeepL 首席履行官雅瑞克·库特洛夫斯基(Jarek Kutylowski)在接收采访时表示,在深耕文本翻译多年之后,语音是公司“瓜熟蒂落的下一步”。 他强调,DeepL 在文本和文档翻译上已经走得很远,但在及时语音翻译范畴,“还缺乏一款真正出色的产品”,这也是公司决定切入的原因。
在技巧路线上,DeepL 称当前产品由自研的完全“语音到语音”技巧栈驱动,但现阶段仍采取“语音转文本—文本翻译—文本转语音”的三步流程。 公司认为,恰是因为经久深耕文本翻译,使其在整体翻译质量上具有优势。 瞻望将来,DeepL 筹划开辟端到端语音翻译模型,省略文本中心步调,以期在延迟和天然度上更进一步。
此次宣布中,DeepL 面向 Zoom 和 Microsoft Teams 推出插件,让听众在长途会议中,可以一边听各方用母语谈话,一边及时听到翻译语音,或在屏幕上浏览及时翻译字幕。 该筹划今朝仍处于早期测试阶段,DeepL 正邀请企业参加候补名单,以便率先试用这项功能。 此外,公司还供给面向移动端和网页的对话产品,支撑用户在当面或长途场景中进行跨说话交换。
对于培训、研究会等多人的线下或线上群组场景,DeepL 许可介入者经由过程扫描二维码参加同一会话,每小我都可以在本身的设备上接收对应说话的翻译内容。 DeepL 表示,其语音到语音技巧还可以进修和适配自定义词汇,例如垂直行业术语、公司名称以及小我姓名等,以晋升在专业场景中的应用后果。
库特洛夫斯基认为,AI 正在重塑将来几年客户办事行业的形态,一个高质量的翻译层可以赞助企业在缺乏本地语种人才、雇用成本高企的市场中,依旧供给多语种办事支撑。 在如许的愿景下,DeepL 欲望自身的语音技巧不仅办事于会议场景,也能成为客服中间和全球化企业的基本说话基本举措措施之一。
在语音与翻译范畴,DeepL 面对来自多家创业公司的竞争。 个中,Sanas 客岁从 Quadrille Capital 和 Teleperformance 融资 6500 万美元,主攻及时修改措辞者口音的技巧,重要面向呼叫中间坐席。 总部位于迪拜的 Camb.AI 则面向媒体与娱乐公司,供给语音合成及翻译办事,赞助客户在大年夜范围内容中完成配音和本地化。 由 Reddit 结合开创人 Alexis Ohanian 的基金 Seven Seven Six 投资的 Palabra,则打造及时语音翻译引擎,强调在翻译过程中尽量保存措辞者本来的声音特点,与 DeepL 正在构建的才能形成更直接的竞争关系。
在文本翻译市场站稳脚跟之后,DeepL 正试图经由过程语音产品扩大自身界线,将技巧延长到会议协作、客户办事和一线功课场景中。 跟着更多企业寻求以 AI 降低跨说话沟通成本,及时语音翻译有望成为新一轮竞争核心,而 DeepL 正在这一赛道上加快构造。

发表评论 取消回复