TTS 语音模型我们都不陌生,前段时间一夜火爆的ChatTTS模型更是效果炸裂,很多人都更换了常用的语音生成模型,转而使用它。
而今天再次为大家介绍一款新型的TTS语言生成模型工具-FishSpeech
。它是一款人人可用的AI音频工具,无论你是专业人士、行业职场人还是小白都可以使用。
FishSpeech
在GitHub上开源不久,但是已经有了3.1k Star量。虽然它是开源项目,但是与其他开源TTS又有些不同,不需要再去搭建部署服务,官方已经发布了功能齐全的网站可供使用。
而且界面还特别赏心悦目,看着就很舒服。接下来为大家介绍下这款TTS工具吧!
FishSpeech 是由FishAudio团队开发的一款TTS语音生成工具,比较出众的Bert-VITS2
语音模型也同样出自该团队,是由So-VITS-SVC
项目的一个维护者冷月
创办的团队。
海量人物音色可供使用,包含明星、游戏人物、动漫角色等
官网在线Demo上,上传了许多创作者训练的各种人物音色,比如理塘丁真、邓紫棋等明星音色,还有原生人物纳西妲、钟离、芙宁娜等,还有海量音色可直接使用。
这个是其他开源TTS模型所不具备的,如果有现成的创作者训练好的音色模型,不需要我们自己再次去训练了(除非觉得效果不好)直接使用即可。
支持自定义构建(训练)声音
FishSpeech 训练不像So-VITS-SVC需要填写一大堆训练参数,有时候还需要进行微调。
它点击 构建声音
标签即可跳转到声音训练界面,只需要提前准备好相关的同一个角色的音频文件,所有文件合集不可大于150M,填写好角色模型名称即可开始训练。
模型图片、描述等其他信息可选,可以不做填写。同时它支持私有训练选项,训练完成后只供个人使用,别人在FishSpeech是看不到的。
文本转语音更加方便
照常的输入需要进行语音转换的文本,选择想要转换的声音音色(可搜索),点击创建即可完成文本转语音功能。
这里提供一个原神中纳西妲的demo:
是不是不论是情感、语速、语调都比较富有特色,有感情的,角色音色训练的也OK。
这款TTS工具可以作为主选(备用)配音工具也是可以的,有兴趣可试一试。
GitHub: https://github.com/fishaudio/fish-speech
官网Demo: https://fish.audio/