V2EX 07月13日 09:39
[分享创造] 把每天的 V2 热帖都转成播客
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文分享了使用 Gemini Flash TTS 技术搭建播客项目的经验。作者开源了一个名为 one-balance 的轮询项目,并结合 zenfeed 网站,实现了播客的自动化生成与发布。文章详细介绍了技术选型、配置方法以及关键技术细节,包括如何利用 Gemini Flash TTS 进行语音合成,并对播客内容进行优化,以提升用户体验。此外,还提供了网站的参考配置,方便读者快速搭建自己的播客平台。

🎙️ 项目核心:作者开源了 one-balance 项目,并结合 zenfeed 网站,实现了播客的自动化生成与发布。这个项目利用 Gemini Flash TTS 技术,将文本内容转化为语音,极大地简化了播客制作流程。

⚙️ 技术细节:文章详细介绍了技术选型和配置方法。其中,transform 配置项中的 to_podcast 部分,定义了播客生成的关键参数,包括估计最大时长、转录文本的优化提示(避免 AI 味)、使用的 TTS 模型(gemini-tts)以及播客主持人的角色设定和声音选择。

🎤 角色设定:为了提升播客的吸引力,作者精心设计了两位播客主持人的角色:小雅和老王。小雅是一位经验丰富、声音甜美、风格活泼的科技播客主持人,负责引导对话;老王是一位资深科技评论员,观点犀利,负责提供专业的科技见解。

💡 优化策略:为了让播客内容更具吸引力,作者在转录文本的优化提示中,要求对话引人入胜、流畅自然,并拒绝 AI 味。这有助于提升听众的收听体验,使播客更具人文关怀和个性化。

撸了个轮询项目( https://github.com/glidea/one-balance) ,终于能白嫖 gemini flash tts 来做播客了

https://zenfeed.xyz/


自行部署请移步 https://github.com/glidea/zenfeed/blob/main/docs/podcast.md

顺便附上网站的参考配置

      - transform:          to_podcast:            estimate_maximum_duration: 3m0s            transcript_additional_prompt: 对话引人入胜,流畅自然,拒绝 AI 味,使用中文回复            tts_llm: gemini-tts            speakers:              - name: 小雅                role: >-                  一位经验丰富、声音甜美、风格活泼的科技播客主持人。前财经记者、媒体人出身,因为工作原因长期关注科技行业,后来凭着热爱和出色的口才转行做了全职内容创作者。擅长从普通用户视角出发,把复杂的技术概念讲得生动有趣,是她发掘了老王,并把他‘骗’来一起做播客的‘始作俑者’。                voice: Autonoe              - name: 老王                role: >-                  一位资深科技评论员,互联网老兵。亲身经历过中国互联网从草莽到巨头的全过程,当过程序员,做过产品经理,也创过业。因此他对行业的各种‘风口’和‘概念’有自己独到的、甚至有些刻薄的见解。观点犀利,一针见血,说话直接,热衷于给身边的一切产品挑刺。被‘忽悠’上了‘贼船’,表面上经常吐槽,但内心很享受这种分享观点的感觉。                voice: Puck        label: podcast_url

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini Flash TTS 播客 自动化 开源
相关文章