
这一宣布时点紧贴竞争敌手动态:就在数小时前,OpenAI 方才推出主打语气和语境把握的 ChatGPT Translate 对象,经由过程双栏界面和主动说话辨认,试图在用户体验和高低文懂得层面挑衅 Google Translate 等传统翻译办事。 与之相对,TranslateGemma 则更强调开放模型才能和在多种基准测试上的整体翻译质量。
今朝,TranslateGemma 全系列模型已经在 Kaggle 与 Hugging Face 平台开放下载,供研究者和开辟者自由实验与二次开辟。 在 OpenAI 把翻译进一步融入聊天式前端产品的同时,Google经由过程开放高机能底层模型,为第三方应用构建供给更多技巧选项,也预示着机械翻译赛道将在开放模型与办事化对象两个层面同时加剧竞争。
TranslateGemma 系列今朝供给 40 亿、120 亿和 270 亿参数三种范围版本。Google给出的评测成果显示,在 WMT24++ 基准上,TranslateGemma 12B 的表示跨越了基本版 Gemma 3 27B,这意味着在参数量不足一半的情况下,可以实现更高吞吐、更低时延,同时保持甚至晋升翻译精确度,对开辟者来说有利于在有限算力情况中安排高质量翻译模型。
在安排场景方面,Google表示,4B 模型针对移动端推理进行优化,合适在手机等终端设备本地运行;12B 模型面向花费级笔记本电脑等本地算力场景;而 27B 模型则须要更强的算力支撑,例如云端单卡 NVIDIA H100 等设备。 在 Vistra 图像翻译基准测试中,TranslateGemma 在图像内文字翻译义务上也取得了更好成就,即便其并未针对该场景进行专门微调,显示出模型在多模态文本懂得方面的潜力。
Google披露,TranslateGemma 的机能晋升来自一个分两阶段的练习流程。第一阶段为有监督微调,研究团队在 Gemma 3 基座模型之上,引入大年夜量人工翻译语料,并结合由 Gemini 模型生成的高质量合成数据进行练习;第二阶段则采取强化进修,经由过程一组嘉奖模型引导翻译质量优化,个中包含 MetricX-QE、AutoMQM 等先辈指标,使模型更趋近天然、相符语境的翻译输出。
相干文章:
ChatGPT Translate上线:OpenAI提议对谷歌翻译的新一轮挑衅

发表评论 取消回复