科大讯飞正式发布星火同传语音大模型,成为国内首个具备端到端语音同传能力的大模型。该模型相较于讯飞之前的翻译技术,在全场景下的翻译效果和响应速度都有显著提升。星火同传语音大模型支持译文长度反向调控,并能在语音到文本的翻译过程中进行流式意群切分、语境理解和信息重组。此外,该模型在流式语音合成方面也支持意群韵律衔接和自适应语速调节。在内容完整度、信息准确度和语言质量上,该模型在国际交流场景中表现出色,甚至超越了谷歌Gemini 2.0和OpenAIGPT-4o,最快可实现5秒以内的同传时延,达到人类专家译员的水平。
🚀讯飞星火同传语音大模型是国内首个具备端到端语音同传能力的大模型,标志着国内语音翻译技术的新突破。
⏱️该模型显著提升了翻译速度,英译中语音同传几乎无延迟,最快实现5秒以内的同传时延,为用户带来更加流畅、精准的同传体验。
🗣️星火同传语音大模型在内容完整度、信息准确度以及语言质量上都处于行业领先水平,支持译文长度反向调控,语音到文本端到端翻译支持流式意群切分、语境理解、信息重组,流式语音合成则支持意群韵律衔接、自适应语速调节。
🌍该模型适用于出国旅游、国际展会等多种场景,满足日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求。
快科技1月15日消息,今日,科大讯飞星火同传语音大模型正式发布,这是国内首个具备端到端语音同传能力的大模型。
相较于讯飞此前的翻译技术,该模型在全场景下的翻译效果提大幅提升,端到端响应时间大幅缩短。
这一优化显著提升了翻译字幕的呈现速度,保证了中英互译的准确性,为用户带来更加流畅、精准的同传体验。
根据讯飞演示,有了星火同传语音大模型加持的讯飞翻译机,英译中语音同传几乎无延迟,适合出国旅游、国际展会等场景使用。


据了解,星火同传语音大模型支持译文长度反向调控,语音到文本端到端翻译支持流式意群切分、语境理解、信息重组,流式语音合成则支持意群韵律衔接、自适应语速调节。


针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求,星火语音同传大模型在内容完整度、信息准确度以及语言质量上都处于行业领先水平,超过谷歌Gemini 2.0和OpenAIGPT-4o,最快实现5秒以内的同传时延,达到人类专家译员的水平。
