IT之家 07月24日 14:08
准确率接近真人,字节跳动发布端到端同声传译模型 Seed LiveInterpret 2.0
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

字节跳动Seed团队发布了Seed LiveInterpret 2.0,这是首个在中英同声传译领域达到接近人类水平的产品级系统。该系统基于全双工端到端语音生成理解框架,能够实时处理多人语音输入,并以极低的延迟(2-3秒)实现“边听边说”,同时支持零样本声音复刻,让翻译更加自然流畅。在测试中,Seed LiveInterpret 2.0能够对长段中文表达进行低延迟、同音色翻译。相比传统系统,其准确率显著提升,多人会议场景下准确率超70%,单人演讲超80%,且能智能平衡翻译质量、延迟和语音输出节奏,适配不同语言特性,保证传译的自然流畅。

🗂️ Seed LiveInterpret 2.0是字节跳动Seed团队推出的首个产品级中英同声传译系统,其核心优势在于实现了接近人类同传译员的延迟和准确率。该系统采用全双工端到端语音生成理解框架,能够同时接收源语言语音输入并输出目标语言翻译语音,从而达到“边听边说”的效果。

🚀 该系统在翻译准确率和延迟方面表现突出。在多人会议等复杂场景下,中英双向翻译准确率超过70%,单人演讲准确率更是超过80%,已接近专业真人同传水平。翻译延迟低至2-3秒,相比传统机器同传系统降低了超过60%,显著提升了沟通效率。

🗣️ Seed LiveInterpret 2.0支持零样本声音复刻,能够仅通过采样实时语音信号,便提取声音特征并用说话人的音色特质进行外语翻译,极大地增强了交流的沉浸感和亲和力。此外,系统还能智能平衡翻译质量、延迟和语音输出节奏,根据语音清晰度、流畅度和复杂程度进行调整,确保超长信息的传译语音节奏自然流畅。

💡 该技术报告已由火山引擎对外开放,并且Ola Friend耳机将于8月底接入Seed LiveInterpret 2.0,成为首个支持该模型的智能硬件设备,预示着该技术将在更多实际应用场景中落地。

IT之家 7 月 24 日消息,今天,字节跳动 Seed 团队正式发布端到端同声传译模型 Seed LiveInterpret 2.0,是首个延迟 & 准确率接近人类水平的产品级中英语音同传系统。

据官方介绍,它基于全双工端到端语音生成理解框架,支持中英互译,可实时处理多人语音输入,像人类同传译员一样以极低的延迟“边听边说”,一边接收源语言语音输入,一边直接输出目标语言的翻译语音。同时,Seed LiveInterpret 2.0 还支持 0 样本声音复刻,让沟通更加流畅自然。

在测试中,可以观察到,Seed LiveInterpret 2.0 面对 40 秒的大段中文表达,能够低延迟地丝滑输出同款音色的英语翻译。此外,Seed LiveInterpret 2.0 还能快速学习音色。

相比传统机器同传系统,Seed LiveInterpret 2.0 模型具备以下优势:

IT之家注意到,目前 Seed LiveInterpret 2.0 技术报告已公布,模型基于火山引擎对外开放。此外,Ola Friend 耳机也将在 8 月底接入 Seed LiveInterpret 2.0,成为首个支持该模型的智能硬件设备。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Seed LiveInterpret 2.0 同声传译 人工智能 语音识别 机器翻译
相关文章