我爱计算机视觉 2024年12月18日
一键部署【OuteTTS-0.2-500M】开源语音合成模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OuteTTS是开源文本到语音项目,采用先进技术进行高质量语音合成。基于LLaMa架构,有多种前沿音频处理方法,具备语音克隆等功能,多版本改进,已在趋动云上线,可一键部署。

🎙OuteTTS基于LLaMa架构,使用Oute3-350M-DEV基础模型,参数高达3.5亿。

🌟引入多种前沿音频处理方法,如音频标记化等,支持语音克隆和自定义声音。

🎉OuteTTS-0.2-500M是改进版,在准确性、自然语音等方面有提升,新增多语言支持。

🚀在趋动云『社区项目』上线,一键克隆,快速部署,节省大量准备时间。

算力君 2024-12-18 13:12 江苏

一键克隆,即刻部署

OuteTTS 是一个创新的开源文本到语音(TTS)项目,采用尖端的语言建模技术进行高质量的语音合成。该项目基于先进的 LLaMa 架构,使用 Oute3-350M-DEV 基础模型,拥有高达 3.5 亿参数。OuteTTS 引入了音频标记化、CTC 强制对齐技术和结构化提示创建等前沿音频处理方法,具备语音克隆功能,并支持用户自定义说话人的声音。它与 llama.cpp 和 GGUF 格式无缝兼容,广泛应用于有声读物、智能客服、语音导航等多种场景。

OuteTTS-0.2-500M 是对 v0.1 版本的改进版,相对于 OuteTTS-0.1 的主要改进:

OuteTTS-0.2-500M模型已经在趋动云『社区项目』上线,无需自己创建环境、下载模型,一键即可快速部署,快来体验OuteTTS-0.2-500M带来的精彩体验吧!

视频教程:

启动开发环境

进入OuteTTS-0.2-500M项目主页中,点击运行一下,将项目一键克隆至工作空间,『社区项目』推荐适用的算力规格,可以直接立即运行,省去个人下载数据、模型和计算算力的大量准备时间。

配置完成,点击进入开发环境,根据主页项目介绍进行部署。

使用方法

找到项目介绍&部署.ipynb,选中WebUI快速体验单元格,点击运行,等待生成local URL,右侧添加端口7860,浏览器访问外部访问链接,

教程图1

项目使用方法:

教程图2
教程图3

示例展示

这还是湘宁尔第一次听丁岚唱曲,她觉得很奇妙


大语言模型是一种通过深度学习技术训练的神经网络模型,旨在理解、生成和操作自然语言。


➫温馨提示: 完成项目后,记得及时关闭开发环境,以免继续产生费用!

智汇全球,趋动未来

『社区项目』汇聚全球智慧,是促进技术交流的宝贵平台,期待每一位AI爱好者体验一键部署功能的强大魅力。

同时,我们也热切盼望每一位码友加入,分享您的精品作品,共筑这个充满活力与创新的技术乐园。


趋动云
连接算力・连接人


注册即领
10元
算力金
更多福利,扫码添加小助手 邀你入群~
做新手任务
再得180元算力金
请注册后联系小助手,获取新手任务

▼HOT 趋动云火热注册中!点击 “阅读原文” 即可尝鲜~

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OuteTTS 语音合成 趋动云 一键部署
相关文章