V2EX 07月13日 10:52
[分享创造] 把每天的 V2 热帖都转成播客
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

该项目基于 Gemini Flash TTS,旨在通过轮询方式实现播客内容生成与发布。用户可自行部署,项目提供了详细的配置指南,包括如何利用 Gemini-tts 和自定义的角色设定,如“小雅”和“老王”,来生成具有个性化风格的播客节目。该项目利用了文本转语音技术,结合引人入胜的对话风格,旨在为听众带来流畅自然的听觉体验。

🎙️项目核心功能:利用 Gemini Flash TTS 实现播客的自动生成,通过轮询机制获取内容并转换为语音。

💡配置详解:项目提供了详细的配置选项,包括 `to_podcast` 参数,可以设置预估时长、转录文本的提示词、使用的 TTS 模型以及播客主持人的角色设定。

🗣️角色设定:项目预设了两位播客主持人,分别为“小雅”和“老王”,分别拥有不同的背景、风格和声音,以增加节目的多样性和吸引力。

⚙️技术实现:项目依赖于 Gemini-tts 模型进行语音合成,并支持自定义角色和对话风格,以增强播客的个性化特征。

撸了个轮询项目( https://github.com/glidea/one-balance) ,终于能白嫖 gemini flash tts 来做播客了

https://zenfeed.xyz/


自行部署请移步 https://github.com/glidea/zenfeed/blob/main/docs/podcast.md

顺便附上网站的参考配置

      - transform:          to_podcast:            estimate_maximum_duration: 3m0s            transcript_additional_prompt: 对话引人入胜,流畅自然,拒绝 AI 味,使用中文回复            tts_llm: gemini-tts            speakers:              - name: 小雅                role: >-                  一位经验丰富、声音甜美、风格活泼的科技播客主持人。前财经记者、媒体人出身,因为工作原因长期关注科技行业,后来凭着热爱和出色的口才转行做了全职内容创作者。擅长从普通用户视角出发,把复杂的技术概念讲得生动有趣,是她发掘了老王,并把他‘骗’来一起做播客的‘始作俑者’。                voice: Autonoe              - name: 老王                role: >-                  一位资深科技评论员,互联网老兵。亲身经历过中国互联网从草莽到巨头的全过程,当过程序员,做过产品经理,也创过业。因此他对行业的各种‘风口’和‘概念’有自己独到的、甚至有些刻薄的见解。观点犀利,一针见血,说话直接,热衷于给身边的一切产品挑刺。被‘忽悠’上了‘贼船’,表面上经常吐槽,但内心很享受这种分享观点的感觉。                voice: Puck        label: podcast_url

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini Flash TTS 播客 TTS 项目
相关文章