钛媒体:引领未来商业与生活新知 03月10日
网易有道突破翻译大模型,14B小参数垂类模型全量上线应用|钛媒体独家
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

网易有道翻译大模型实现底层技术迭代,14B小参数垂类模型全量上线,性能提升,已在多产品中应用。该模型在数据、算法、评估层面有优化,在多领域翻译准确率和流畅度提高,有道更看重垂类模型的未来价值。

🎯14B小参数垂类模型上线,计算资源消耗少,部署成本低

💻翻译技术在有道多产品中应用,词典笔X7系列已升级

📊数据层面收集清洗高质量语料并人工标注,增强应对能力

🧠算法层面进行二次预训练,结合多种技术提升翻译性能

📋评估层面研发评估模型,多维度评估分析翻译结果

图片来自网易有道

3月10日,钛媒体APP从网易有道独家获悉,有道翻译大模型已经实现底层技术迭代,基于自主研发的子曰翻译大模型2.0,其中,14B小参数垂类模型,实现了高水准的翻译性能,现在已经全量上线。

14B小参数垂类模型推出,意味着在训练和推理时,AI翻译消耗的计算资源更少,部署的成本更低,更容易集成到现有系统和设备中,适合更多的实际场景。

钛媒体APP观察到,搭载全新大模型的翻译技术,已在有道词典、有道翻译及有道翻译官内上线,提供标准模型和高级模型两种不同参数的选择,用户可直接切换使用。

与此同时,该大模型已经上线网易有道旗下智能硬件产品,有道词典笔X7系列已升级为最新的翻译大模型,其余型号将陆续更新。

事实上,大语言模型的性能并非完全由参数量决定,很大程度上也依赖于数据质量、领域适配性与算法优化的结合。

钛媒体APP了解到,网易有道之所以能够实现14B小参数垂类模型,是因为,在数据层面,新的模型技术收集并清洗了高质量的翻译语料数据,并由英语专业八级认证人员及职业译员进行精细化人工标注,使得模型拥有海量的优质数据资源库,增强其在多样化翻译场景的应对能力。

而在算法层面,有道以子曰大模型为基础,进行了二次预训练,打造了兼具专业性与针对性的翻译基座大模型,结合大模型蒸馏技术、大模型融合技术和Online DPO(在线直接偏好优化)技术等手段,避免了大模型的灾难性遗忘等问题,并在运行效率、准确性、流畅性等翻译性能上实现大幅提升。

最后是在评估层面,借助翻译数据沉淀,有道研发了翻译评估模型Reward Model,为子曰翻译大模型的性能评估,提供一个可靠的量化依据,以及完善的人工评估方案,多维度对模型的翻译结果进行评估和分析。

垂类模型通过聚焦特定领域,在特定任务的优化上,具备相对优势。在垂直场景上,子曰翻译大模型2.0,在中英文互译领域有所突破,译文的专业度和稳定性较前代版本均有提升。

此外,根据有道内部测评,新的翻译模型在人文学科、商科、生活服务、医疗、科学等19个垂直领域的多学科的专业性、准确性、语言惯例和风格等方面,展现出了相比之前更高的翻译准确率和流畅度。

网易有道相关负责人对钛媒体APP表示,“通用大模型比的是参数大和算力强,但翻译靠参数堆不出专业度。当通用大模型竞逐参数规模时,我们更相信垂类模型的未来价值,用专业的垂直应用真正解决专业场景的痛点,也是我们持续努力的方向。”

大模型技术浪潮之前,有道翻译技术主要基于统计机器翻译及神经网络翻译技术(NMT)。

截至目前,有道全系翻译产品拥有超10亿用户。Quest Mobile数据显示,网易有道词典月活跃用户数已超过1亿,自2019年起,已连续六年位居教育类工具领域榜首。(本文独家首发于钛媒体APP,作者|李程程)

 

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

网易有道 翻译大模型 垂类模型 翻译技术 性能提升
相关文章