V2EX 6小时前
[分享发现] [教程] 免费 AIGCPanel➕CosyVoice 声音合成和声音克隆
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AIGCPanel是一款开源的数字人软件,提供直观界面,方便用户管理和使用多种声音及视频AI模型。其集成的CosyVoice是基于先进深度学习技术的专业语音合成引擎,能生成高度自然的语音,并支持个性化语音克隆。用户只需在AIGCPanel官网下载安装软件,然后在模型库中选择并下载CosyVoice模型,导入后即可启动。通过“我的音色”功能,上传5-10秒的音频即可完成声音克隆,并可输入文字进行声音合成,快速获得个性化语音效果。软件对模型路径和文件名有字符限制,建议使用纯英文或数字命名。

🚀 AIGCPanel作为一款强大的开源数字人软件,提供了用户友好的界面,使用户能够便捷地管理和运用各类声音AI模型及视频AI模型,极大地降低了数字人技术的应用门槛。

🔊 CosyVoice是一款领先的语音合成引擎,它运用尖端的深度学习技术,致力于生成极其自然流畅的语音,并具备强大的个性化语音克隆能力,让用户能够创造出独一无二的语音。

💾 用户在AIGCPanel官网下载并安装软件后,需在模型管理中找到并下载CosyVoice模型(如0.5b、300m-instruct、300m版本),其中0.5b模型效果更佳但资源消耗更大。模型文件路径和命名需避免特殊字符,建议使用纯英文或数字。

💡 完成模型导入与启动后,用户可通过“我的音色”功能进行声音克隆,只需上传5-10秒的清晰音频,并输入克隆文字即可生成个性化音色。随后,在声音合成界面选择克隆好的音色,输入文本即可快速生成语音。

🔧 AIGCPanel和CosyVoice的结合,为用户提供了一站式的解决方案,无论是声音克隆还是语音合成,都能在直观的操作下高效完成,为内容创作者和开发者提供了极大的便利。

AIGCPanel 和 CosyVoice 介绍

AIGCPanel 是一个功能强大的开源数字人软件,提供直观的用户界面,让用户能够轻松管理和使用各种声音 AI 模型和视频 AI 模型。

CosyVoice 是一款专业的语音合成引擎,基于最先进的深度学习技术,能够生成自然流畅的语音,并支持个性化的语音克隆功能。

下载并安装 AIGCPanel

访问 AIGCPanel 官网 ,在下载页面选择适合您操作系统的版本。

下载完成后进行安装

完成基本设置后,进入主界面。

下载 CosyVoice 模型

在 AIGCPanel 官网,点击"模型",找到 CosyVoice 模型,目前支持 0.5b 、300m-instruct 、300m 这几个版本。

其中,0.5b 的模型效果更好一点,本地合成更费资源一点。

导入模型并启动

模型下载完成后,解压到本地的目录,需要注意解压的完整路径不要包含特殊字符。

模型的保存路径不要用中文和一些特殊符号,例如:空格、 [] 、()等,文件的命名同样也是上述标准, 最好用纯英文 或者数字命名文件。

进入 AIGCPanel 的模型,点击右上角选择导入模型

导入完成后,点击启动,等待模型启动完成

声音克隆

进入我的音色界面,上传被克隆的声音,注意声音保留 5-10 秒即可,太长的声音反而效果不好。

进入声音克隆界面,选择 CosyVoice 模型,选择被克隆的音色,输入克隆文字,点击提交。

等待克隆完成,这时候就可以看到声音克隆的结果,直接点击可以播放。

声音合成

进入声音合成界面,选择 CosyVoice 模型,选择需要合成音色,输入合成文字,点击提交。

等待合成完成,这时候就可以看到声音合成的结果,直接点击可以播放。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AIGCPanel CosyVoice 语音合成 声音克隆 数字人
相关文章