哈喽呀!我是成峰!
上次我分享了那个 Chrome MCP 的小技巧之后
后台有不少朋友问我同一个问题:“AI 怎么转译音频呢?”
今天,我就把我的压箱底的个人工作流,完完整整地给大家跑一遍!
💡 🤔 所以…我为啥要折腾这个?
我的目的超级简单:用最少的钱(最好是不花钱!),搞一套完全属于我自己的、全自动的AI学习小宝库!
而核心秘方,就是这个公式:
Cursor(Claude Code、gemini) + Chrome MCP + 开源工具 = 爽到飞起的本地知识库
这套组合拳的优势:
✅ 成本最低:无需为多个平台付费
✅ 无限制:文件大小不受限
✅ 学习成本低:一站式处理,从下载到分析
✅ 用最强的模型:Claude/Gemini的文本理解和分析能力超强
🔄 工作流对比
想想以前,我们是怎么干活的:
吭哧吭哧找链接 → 打开下载器 → 上传到某个死贵的平台 → 等啊等…… → 下载稿子 → 最后还要自己手动整理到眼花……我的天!
再看看现在,我怎么“偷懒”的:
丢一句话给AI → 喝口水,然后拿到一篇完美的逐字稿!
是的,就这么简单。
🤯 等等!这听起来是不是超级复杂?
NO!NO!NO!
恰恰相反!这简直是我用过最“傻瓜”的流程了!
整个过程几乎都是AI自己在那儿忙活
我们呢?像个大老板一样,偶尔指挥一下就行了。
说真的,只要你会用Cursor,你就已经100%能上手了!
🚀 Talk is cheap, show me the code!
光说不练假把式!我们直接来个现场教学!
昨天我看到“42章经”有一期非常顶级的播客:《关于AI Infra的一切 | 对谈阶跃星辰联创朱亦博》,内容很干,我们今天就拿它演示。
第一步:一句话,启动一切
我打开我的AI工具,敲了下面这行字
用chrome mcp,@博客链接 找到这个页面的音频源,并下载
然后……然后就没我啥事了!真的!AI自己就开始表演了!
1.找到音频源
AI 操控 Chrome MCP 插件,在网页的源代码里精准地找到了那个隐藏的音频文件地址。
2. 自动下载
找到地址后,AI 自动匹配了最合适的下载命令,直接在后台开始下载。
3.下载完成!
就一眨眼的功夫,一个56.4MB的高清音频文件,就乖乖地躺在我文件夹里了!
第二步:召唤 Whisper !
音频有了,下一步就是见证 AI 神奇的时刻!
这里,我们请出我们的超级英雄:OpenAI 的 Whisper!
你可以直接把它当成是“不要钱、随便用的通义听悟”!
它有啥优点?
* 免费!免费!还是免费! 重要的事情说三遍!
* 中文超溜! 识别率高到让你想给它磕一个!
* 超级贴心! 连标点符号都给你整得明明白白的!
我们还是一样,当个甩手掌柜,给AI下个命令:
安装openai Whisper,并转录 @播客文件.mp4
(如果你是第一次用,AI会先帮你把环境装好,一次安装,终身使用)
然后你就能看到AI开始吭哧吭哧地干活啦,下载模型、解决问题……
看着屏幕上滚动的代码,AI正在一个字一个字地把声音变成文字!
第三步:还没完!让AI给咱划重点!
三万多字的稿子到手了!但是……谁有空看啊!
别急!我们的目标是“知识”,不是“文字”!所以,最后一步,当然是让AI帮我们“读书”啦!
我把稿子往AI面前一扔,问:
@转译文本 这个音频讲了什么
AI“刷”的一下就读完了全文,然后把核心观点、关键信息、有趣细节,全都整理得漂漂亮亮地交给了我!
这效率,简直了!
以上的一切,还有更进阶的玩法,做一个 文字版工作流 + 内容提示词。
如果你需要,可以在评论区告诉我!
🎉 看看我们的最终战利品!
走完这一套流程,我几乎没费什么力气,就收获了以下成果:
1. 一份高清原始音频 (想听随时听!)
2. 一份三万多字的完整逐字稿 (细节狂魔的福音!)
3. 一份AI划好的重点笔记 (节省了我至少2个小时!)
4. 一个可以随时搜索的知识卡片 (这才是无价之宝!)
而且哦,这套玩法不光能搞播客,像什么会议录音、上课视频、采访记录……统统都能搞定!
✨ 最后的最后,聊几句心里话
说实话,这套 Chrome MCP + Whisper + Claude 的“神仙组合”,可能不是那种点一下就行的“傻瓜”方案
但它绝对是目前我心中,性价比、自由度和专业性都拉到最满的顶级方案!
它意味着:
* 零成本:跟大多数付费订阅彻底说拜拜!
* 高效率:让AI去干重复的活,我们只负责创意和思考!
* 超安全:所有东西都在你自己的电脑里,再也不用担心隐私泄露!
* 无限可能:你甚至可以自己动手,DIY出更强大的自动化流程!
希望今天这个小小的(但超级强大的!)工作流,能让你的AI之旅变得更有趣一点点!
好啦,今天的分享就到这里啦!