V2EX 07月13日 09:17
[分享创造] 把每天的 V2 热帖都转成播客
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文分享了一个基于Gemini Flash TTS的免费播客方案,通过开源项目实现了播客节目的制作。该方案详细介绍了如何利用Gemini Flash TTS进行语音合成,并提供了网站配置的参考。文章重点介绍了如何通过调整参数,优化播客内容的质量,包括对话的流畅性和自然度。此外,还介绍了播客主持人的角色设定,以及如何通过不同的声音和角色来丰富播客内容。

🎙️ 该方案的核心是使用Gemini Flash TTS进行语音合成,实现播客节目的语音输出。用户可以通过调整参数来优化语音质量,确保语音的流畅度和自然度。

💻 方案提供了网站配置的参考,方便用户自行部署和定制自己的播客网站。用户可以根据自己的需求,灵活配置播客的各种参数,例如语音风格、语速等。

🎤 播客内容制作中,作者强调了对话的引人入胜和自然流畅,避免AI味。通过精心设计的prompt,可以使生成的对话更具吸引力,更符合听众的口味。

🗣️ 播客方案中设定了两位主持人,小雅和老王,分别代表不同的角色和声音。小雅是经验丰富的科技播客主持人,老王是资深科技评论员,这种角色设定可以丰富播客内容,增加趣味性。

撸了个轮询项目( https://github.com/glidea/one-balance) ,终于能白嫖 gemini flash tts 来做播客了

https://zenfeed.xyz/


自行部署请移步 https://github.com/glidea/zenfeed/blob/main/docs/podcast.md

顺便附上网站的参考配置

      - transform:          to_podcast:            estimate_maximum_duration: 3m0s            transcript_additional_prompt: 对话引人入胜,流畅自然,拒绝 AI 味,使用中文回复            tts_llm: gemini-tts            speakers:              - name: 小雅                role: >-                  一位经验丰富、声音甜美、风格活泼的科技播客主持人。前财经记者、媒体人出身,因为工作原因长期关注科技行业,后来凭着热爱和出色的口才转行做了全职内容创作者。擅长从普通用户视角出发,把复杂的技术概念讲得生动有趣,是她发掘了老王,并把他‘骗’来一起做播客的‘始作俑者’。                voice: Autonoe              - name: 老王                role: >-                  一位资深科技评论员,互联网老兵。亲身经历过中国互联网从草莽到巨头的全过程,当过程序员,做过产品经理,也创过业。因此他对行业的各种‘风口’和‘概念’有自己独到的、甚至有些刻薄的见解。观点犀利,一针见血,说话直接,热衷于给身边的一切产品挑刺。被‘忽悠’上了‘贼船’,表面上经常吐槽,但内心很享受这种分享观点的感觉。                voice: Puck        label: podcast_url

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini Flash TTS 播客 开源项目 语音合成
相关文章