ElevenLabs推出全新Turbo v2.5文本到语音AI模型,支持包括普通话在内的32种语言,覆盖全球近80%的地区。该模型首次支持越南语、匈牙利语和挪威语,并显著提升了包括印地语、法语、西班牙语和普通话在内的27种语言的响应速度,最高提升3倍。Turbo v2.5模型结合了先进的文本到语音技术和最新的低延迟模型架构,为用户提供高质量、低延迟的AI生成音频输出,响应时间不超过400毫秒。
😄 **支持更广泛的语言:** Turbo v2.5 模型首次支持越南语、匈牙利语和挪威语,将 ElevenLabs 的服务覆盖范围扩展至全球近 80% 的地区。
🚀 **更快的响应速度:** 此更新重点提高了印地语、法语、西班牙语、普通话和其他 27 种语言的响应速度,最高提升了 3 倍。英语的速度也提高了 25%。
✨ **高质量、低延迟的AI生成音频输出:** Turbo v2.5 模型结合了先进的文本到语音技术和最新的低延迟模型架构,为用户提供高质量、低延迟的AI生成音频输出,响应时间不超过 400 毫秒。
🤝 **重视人工智能内容的透明度:** ElevenLabs 开发了 AI Speech Classifier 等工具帮助识别合成音频,并正在开发用于电影配音的工具和一个允许用户生成 AI 语音并通过授权赚钱的平台。
💪 **持续发展:** ElevenLabs 目前拥有约 40 名远程办公员工,并计划到年底将团队扩大至 100 人,展现了其在人工智能语音技术领域的持续投入和发展。
IT之家 7 月 20 日消息,ElevenLabs 昨日(7 月 19 日)发布博文,介绍推出了全新的 Turbo v2.5 文本到语音 AI 模型,支持普通话等 32 种语言,为全球近 80% 的地区提供高质量、低延迟的 AI 对话。
Turbo v2.5 模型首次支持越南语、匈牙利语和挪威语,这些语言的使用人数分别为 8500 万、1300 万和 530 万。
本次更新还重点提高了印地语、法语、西班牙语、普通话和其他 27 种语言的响应速度,最高提升了 3 倍;英语的速度提高了 25%。IT之家附上宣传视频如下:
Turbo v2.5 模型结合了先进的文本到语音技术和最新的低延迟模型架构,用户基本上不需要等待,就能提供高质量的 AI 生成音频输出。
Turbo 模型实现了快速语音合成,同时保持流畅和自然的高品质音质,响应时间不超过 400 毫秒。
ElevenLabs 成立于 2022 年,总部位于伦敦,专注于开发人工智能语音模型和工具,可以创建不同语言、口音和情感的合成语音。
公司首席执行官 Mati Staniszewski 表示,ElevenLabs 目前拥有约 40 名远程办公员工,分布在全球各地,并计划到年底将团队扩大至 100 人。
ElevenLabs 非常重视人工智能内容的透明度,并开发了 AI Speech Classifier 等工具帮助识别合成音频,同时也在开发用于电影配音的工具,并正在开发一个允许用户生成 AI 语音并通过授权赚钱的平台。