从语义润饰到图文混淆,从文风调节到设备端运行,AI翻译不再是“你说我译”,而是对人类沟通方法的全新重构。

不合于OpenAI几乎悄无声气的上线ChatGPT翻译,Google全网高调宣布宣布了支撑55种说话的开源翻译模型TranslateGemma。





这切实其实值得一说,AI正在降低沟通障碍,全网好评赓续。


用户可以经由过程预设的提示词选项,一键调剂译文的语气,如“更流畅”、“商务正式”、“儿童易懂”或“学术风格”,从而实现针对不合受众的精准表达。


ChatGPT:狙击Google翻译

近日,OpenAI初次挑衅Google翻译。

一款名为ChatGPT Translate的自力翻译对象,低调上线了。

互联网档案馆(Internet Archive)的Wayback Machine上有一张11月份的网页快照:https://web.archive.org/web/20251119103023/https://chatgpt.com/translate/

看起来与当前页面几乎一致,但这也可能只是 OpenAI 在测试该对象的线上版本。

该对象支撑跨越 50 种说话,基本界面与Google翻译高度类似。



但在功能逻辑上,ChatGPT翻译引入了生成式AI的核心优势,最大年夜亮点在于翻译后的“二次加工”才能:

今朝,ChatGPT Translate仅以网页情势存在,并没有专门的App。


/

是以,离线应用似乎仍无从谈起。

从说话模型到语境模型,再到认知协同体系,AI正在让世界重写沟通规矩。

假如没有一款支撑端侧翻译的应用,ChatGPT Translate对于在无收集的偏远地区观光的用户来说可能并不实用。

别的,它也尚未供给及时对话翻译功能。比拟之下,Google的Pixel 10如今已经支撑通话语音及时翻译。

<video id="vjs_video_3_html5_api" tabindex="-1" preload="auto" src="https://video19.ifeng.com/video09/2026/01/16/p7417903452673544192-102-202001.mp4?reqtype=tsl"></video>

Current Time 0:00

Duration 3:27

主动播放

此前,ChatGPT已可以用于多说话翻译义务,但这照样OpenAI第一次推出自力的AI翻译办事,并且无需登录可免费应用。


2023年,沃顿商学院传授Ethan Mollick就留意到,ChatGPT翻译才能出色:

尽管ChatGPT就是为了英语中应用而构建,并不是翻译对象,但在一些小范围测试中,在翻译才能上,ChatGPT经常优于Google Translate(Google翻译)


2024年,美国明尼苏达州当局应用ChatGPT加快并扩大年夜面向非英语居平易近的翻译办事

明尼苏达州企业翻译办公室应用ChatGPT将当局文件翻译成多种说话

然而,作为第一版产品,它今朝在功能完全性上仍落后于Google,暂不支撑文档、网页及手写翻译、图片翻译功能。

人工智能帮助流程将翻译时光从数周缩短至48小时以内

自实施以来,该办公室已处理了3000份翻译请求,累计翻译跨越200万字

12B参数范围的TranslateGemma模型,在WMT24++基准测试中应用 MetricX 衡量后,机能超出了27B的Gemma 3基线模型。


客岁,网友应用过ChatGPT翻译功能后,直呼:头皮发麻,这就是双语及时翻译天花板。


ChatGPT Translate的问世标记住翻译对象正从纯真的“说话转换”向重视语境与交互的“智能适应”偏向演进。

不过,尽管这些语气与语境方面的才能颇具吸引力,ChatGPT Translate与Google翻译比拟仍显得有些“半成品”——

后者已成长了数十年,比来还经由过程基于Gemini的改版进一步加强了对习语和俚语懂得的支撑。

并且,Google此次直接开源了最新的翻译AI模型,直面ChatGPT的挑衅。


GoogleTranslateGemma让手机翻译55种说话

支撑55种说话,并在近500种附加说话对长进行了练习,以供进一步研究

效力出色:12B模型超出了27B基线模型,在参数数量不到一半的情况下实现了更优的机能

保存多模态才能:可以或许翻译图像中的文本,而无需特定的多模态练习

灵活的安排选项:4B实用于移动设备/边沿设备,12B实用于花费级笔记本电脑,27B实用于云GPU/TPU

OpenAI 几乎没有任何公开宣传,今朝都不知道ChatGPT Translate具体何时上线。


在对模型的技巧评估中,最令人注目标发明是它们的效力表示。

这对开辟者来说无疑是巨大年夜利好:只需不到一半的参数量,就能实现高度保真(high-fidelity)的翻译质量。

这项效力上的冲破,意味着可以在不就义精确性的前提下,实现更高的吞吐量与更低的延迟。

同样值得留意的是,4B模型的表示已接近本来的12B基线程度,这使得它成为移动端推理的幻想选择。


这意味着开辟者可以构建完全在设备端运行的低延迟翻译对象。

TranslateGemma的背后,源自Gemini模型体系。

之所以能实现如斯高密度的智能表示,关键在于一种专门设计的双阶段微调流程,将Gemini模型的“直觉”成功蒸馏并融入开放架构中。

第一阶段:监督式微调(SFT)

他们以Gemma 3的基本模型为起点,应用多样化的平行语料进行微调。这些语料既包含由人工翻译的高质量文本,也涵盖由最先辈的Gemini模型生成的高质量合成译文,覆盖范围广泛,甚至在低资本说话上也能保持出色的翻译保真度。

第二阶段:强化进修优化(RL)

为了进一步晋升翻译质量,他们引入了立异性的强化进修环节。在这一阶段,他们构建了一套嘉奖模型的集成体系,包含MetricX-QE和AutoMQM等先辈评估指标,引导模型生成更具高低文精确性、听起来更天然的译文。

此外,TranslateGemma延续了Gemma 3在多模态方面的强大年夜才能。

在Vistra图像翻译基准上的测试注解,即使在练习过程中并未专门进行多模态微调,其文本翻译才能的晋升也明显加强了模型处理图像中文字翻译的表示。

这意味着,TranslateGemma 在文字与图像的交叉处理才能上,也具有天然的优势。

基于Gemma 3,Google宣布了开源翻译模型TranslateGemma,它异常酷:

这场由OpenAI与Google引燃的AI翻译之争,早已超出“谁更精确”的争议,而是走向“谁能更像人、谁能真正懂人”的深层较劲。

而真正的赢家,或许是全人类。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部