V2EX 07月13日 16:28
[分享创造] 把每天的 V2 热帖都转成播客
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了使用开源项目one-balance和zenfeed,结合Gemini Flash TTS技术制作播客的实践。通过轮询项目,用户可以白嫖Gemini Flash TTS服务,实现播客的自动生成。文章详细介绍了配置过程,包括使用transform功能将文本转换为播客格式,并提供了网站的参考配置。此外,还描述了播客中两位主持人的角色设定,以及如何通过prompt调整生成内容的风格,使其更具吸引力,避免AI味,力求流畅自然的中文表达。

🎙️ 核心技术:利用Gemini Flash TTS,实现文本到语音的转换,为播客提供声音支持。通过开源项目one-balance轮询调用Gemini Flash TTS,实现免费使用。

⚙️ 技术实现:结合zenfeed项目,通过配置实现播客的自动化生成。网站配置中,transform功能将文本转换为播客格式,并设置了最大时长、转录文本的prompt等参数。

🗣️ 角色设定:播客包含两位主持人,小雅和老王。小雅声音甜美,风格活泼,负责从用户视角解读科技;老王观点犀利,热衷挑刺,提供深刻的科技评论。

📝 Prompt 优化:通过在配置中添加transcript_additional_prompt参数,引导AI生成的文本更具吸引力,避免AI味,确保流畅自然的中文表达。

撸了个轮询项目( https://github.com/glidea/one-balance) ,终于能白嫖 gemini flash tts 来做播客了

https://zenfeed.xyz/


自行部署请移步 https://github.com/glidea/zenfeed/blob/main/docs/podcast.md

顺便附上网站的参考配置

      - transform:          to_podcast:            estimate_maximum_duration: 3m0s            transcript_additional_prompt: 对话引人入胜,流畅自然,拒绝 AI 味,使用中文回复            tts_llm: gemini-tts            speakers:              - name: 小雅                role: >-                  一位经验丰富、声音甜美、风格活泼的科技播客主持人。前财经记者、媒体人出身,因为工作原因长期关注科技行业,后来凭着热爱和出色的口才转行做了全职内容创作者。擅长从普通用户视角出发,把复杂的技术概念讲得生动有趣,是她发掘了老王,并把他‘骗’来一起做播客的‘始作俑者’。                voice: Autonoe              - name: 老王                role: >-                  一位资深科技评论员,互联网老兵。亲身经历过中国互联网从草莽到巨头的全过程,当过程序员,做过产品经理,也创过业。因此他对行业的各种‘风口’和‘概念’有自己独到的、甚至有些刻薄的见解。观点犀利,一针见血,说话直接,热衷于给身边的一切产品挑刺。被‘忽悠’上了‘贼船’,表面上经常吐槽,但内心很享受这种分享观点的感觉。                voice: Puck        label: podcast_url

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini Flash TTS 播客 开源项目 AI 自动化
相关文章