IT之家 2024年12月26日
腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

腾讯研究院推出的DRT-o1系列模型,通过长思维链CoT技术,显著提升了文学作品的翻译质量,尤其在处理隐喻和明喻等修辞手法时表现出色。该模型采用多智能体框架,包含翻译员、顾问和评估员三个角色,通过反复迭代优化翻译结果。研究人员利用大量文学作品进行训练,并用GPT-4o进行润色,最终生成高质量的翻译样本。实验结果表明,DRT-o1模型在BLEU和CometScore等指标上均优于其他模型,甚至超越了更大规模的模型,展现了其在复杂语言结构处理方面的卓越能力。

🧠DRT-o1模型采用长思维链(CoT)技术,使其能更深入理解文学作品中的比喻和隐喻,从而提高翻译的准确性和质量。

🎭该模型创新地引入多智能体框架,包含翻译员、顾问和评估员三个角色,通过反复迭代优化翻译结果,确保翻译的准确性和流畅性。

📚研究人员从古腾堡计划中提取大量文学作品进行训练,并筛选出包含明喻和隐喻的句子,用于模型的深度学习,增强其对复杂语言的理解和翻译能力。

📈实验结果显示,DRT-o1模型在BLEU和CometScore等指标上均显著优于其他模型,甚至超越了更大规模的模型,充分证明了其在处理复杂语言结构方面的强大能力。

IT之家 12 月 26 日消息,腾讯研究院最新推出了 DRT-o1 系列模型,主要通过长思维链(long chain-of-thought,简称 CoT),更能理解比喻和隐喻等,从而提高文学作品的翻译质量。

项目背景

IT之家注:神经机器翻译(NMT)在处理日常文本翻译方面已取得显著进展,但在翻译文学作品时,特别是隐喻和明喻等修辞手法时,仍面临巨大挑战。

这些表达通常蕴含深厚的文化和语境含义,简单的直译往往无法准确传达其内涵,而腾讯开发的 DRT-o1 系统,为解决这一难题提供了新的思路。

项目介绍

研究人员从古腾堡(Project Gutenberg)计划中选取 400 本公共领域英文书籍,提取 577600 个句子,并筛选出 63000 个包含明喻和隐喻的句子,用于训练模型进行“深度思考”。

DRT-o1 采用了一种创新的多智能体框架,包含翻译员、顾问和评估员三个角色。翻译员负责初步翻译,顾问提供修改建议,评估员则根据预设指标对翻译质量进行评分,通过反复迭代,不断提升翻译质量。

工作流程包括三个主要步骤:

最终的翻译结果会由 GPT-4o 进行润色,确保流畅性和可读性,最终数据集包含 22264 个经过深度思考的机器翻译样本。

开发者提到了一个例子,原文是:

The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.

这句话中的“struck her all of a heap”是一个成语,表示某事对她产生了强烈的影响。DRT-o1 模型通过长链思考过程,最终将其翻译为:

母亲将双脚搭在凳子上,似乎在努力探究那个答案,那答案中女性特有的深刻性令她猛然心生震撼。

这个翻译不仅传达了原文的意思,还保留了原文的情感色彩。作为对比,IT之家附上谷歌翻译如下:

母亲双脚撑在凳子上,似乎想弄清楚这个答案的真相,其女性的深刻性让她大吃一惊。

Deepl 的翻译如下:

母亲把脚支在凳子上,似乎想弄清这个答案的来龙去脉,而这个答案的女性化深刻性让她茅塞顿开。

性能

DRT-o1 系列共有 DRT-o1-7B 和 DRT-o1-14B 两个规模版本。

实验结果表明,与 Qwen2.5-7B-Instruct 相比,DRT-o1-7B 的 BLEU 分数提高了 8.26 分,CometScore 提高了 3.36 分;与 Qwen2.5-14B-Instruct 相比,DRT-o1-14B 的 BLEU 提高了 7.33,CometScore 提高了 1.66。

DRT-o1-7B 的性能甚至超过了更大的模型 QwQ-32B,BLEU 分数高出 7.82 分,CometScore 高出 1.46 分,展现了其在处理复杂语言结构方面的强大能力。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DRT-o1模型 机器翻译 长思维链 文学翻译 腾讯研究院
相关文章