IT之家 01月21日
MiniMax 海螺语音 AI 产品上线:支持 17 种语言生成,最长可输入多达 10000 字符
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

MiniMax发布了全新升级的T2A-01系列语音模型,并推出了海螺语音产品。该产品允许用户通过输入文字生成自然流畅的超拟人人声,支持多达10000字符的输入。用户可以自定义语音的情绪、语速、音高和音色,以满足不同场景的精细化需求。海螺语音支持包括中文、英语、日语等17种语言,并在中文的字错率和相似度方面表现最佳,英文的字错率和相似度也接近真实录音。此外,海螺语音还具备情感理解能力,能够重现语音中的情感差别,并预置了300多种不同风格的音色供用户选择。

🗣️海螺语音基于T2A-01系列模型,用户可通过输入文字生成高度拟真的语音,支持17种语言,单次输入可达10000字符。

⚙️用户可以自由调整语音的情绪、语速、音高和音色,满足复杂场景的精细化需求,并具备情感理解能力,能智能识别并重现语音中的情感差别。

🎚️海螺语音提供300+音色选择,涵盖不同语种、口音、性别和年龄,风格多样,适用于有声书、ASMR、新闻播报等多种场景。

📈评测结果显示,海螺语音在中文的字错率和相似度表现最佳,英文的字错率、相似度接近真实录音,表明其在语音合成质量上具有较高水平。

IT之家 1 月 21 日消息,MiniMax 昨日宣布,带来全新升级的 T2A-01 系列语音模型,并全球同步上线海螺语音产品。

据介绍,依托于 T2A-01 系列语音模型,用户在海螺 AI 仅需输入文字即可生成自然、流畅的超拟人人声,最长可输入多达 10000 字符。与此同时,用户可以根据需要自由配置输出语音的情绪、语速、音高,甚至调整音色效果,满足复杂场景的精细化需求。

IT之家注意到,海螺语音支持中文、粤语、英语、日语、韩语、阿拉伯语、葡萄牙语、西班牙语、法语、意大利语、印尼语、荷兰语、俄语、德语、越南语、土耳其语、乌克兰语等 17 种语言生成。

官方称,用和 Seed-TTS 论文相同的评测集和评测工具(WER:合成音频的文本和 asr 识别结果计算词错率;SIM:用说话人识别工具计算合成音频和真实音频的距离,表示复刻相似度)来计算海螺语音的字错率和相似度(加粗数字评分代表更优结果)。结果显示,海螺语音在中文的字错率和相似度最好,英文的字错率、相似度和真实录音「Human」接近。

海螺语音具备情感理解能力,能够智能地识别并重现语音中细微的情感差别,让声音更加鲜活,情绪表达更加精准。同时,还预置不同语种共计 300 + 音色供用户选择,用户可按语言、口音、性别和年龄分类筛选。音色多变,不羁、诙谐、慈祥等风格丰富多样,有声书、ASMR 耳语、新闻播报等场景均可适用。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniMax 海螺语音 语音模型 T2A-01 AI语音
相关文章