掘金 人工智能 10小时前
哇塞!Chrome MCP + OpenAI Whisper = 播客秒变学习笔记
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文分享了一个低成本、高效率的AI工作流,将播客音频转化为可搜索的知识库。通过Cursor、Chrome MCP插件和开源工具Whisper,可以实现音频自动下载、逐字转录,并利用Claude/Gemini等大模型进行内容提炼和总结。这一流程不仅极大节省了时间,还解决了隐私担忧,为用户构建个人AI学习宝库提供了实用方案,适用于播客、会议录音、课程视频等多种场景。

💡 **零成本构建AI学习宝库**:作者利用Cursor、Chrome MCP插件以及开源工具(如Whisper)的组合,实现了一个低成本甚至免费的AI工作流,用于处理音频内容,无需为多个平台付费,也无文件大小限制。

🚀 **一站式自动化音频处理**:整个工作流高度自动化,用户只需通过一句话指令,AI即可自动完成音频源查找、下载,再到使用Whisper进行免费且高识别率的中文语音转文字(逐字稿),省去了繁琐的手动操作。

🧠 **AI深度提炼与总结**:在获得完整的逐字稿后,可进一步利用Claude/Gemini等强大的AI模型,对长篇内容进行智能阅读和分析,提取核心观点、关键信息和有趣细节,生成结构清晰的重点笔记,显著提升信息获取效率。

🔒 **隐私安全与无限可能**:该方案将所有数据和处理过程都限制在本地计算机内,确保了用户数据的隐私和安全。同时,这种DIY的自动化流程也为用户提供了极大的自由度和无限的扩展可能性,可以根据需求进行进一步的优化和定制。

✅ **多场景应用价值**:该工作流不仅适用于播客的转译与总结,还能广泛应用于会议录音、在线课程视频、采访记录等多种音频和视频内容的处理,帮助用户高效积累和管理个人知识资产。

哈喽呀!我是成峰!

上次我分享了那个 Chrome MCP 的小技巧之后

后台有不少朋友问我同一个问题:“AI 怎么转译音频呢?”

今天,我就把我的压箱底的个人工作流,完完整整地给大家跑一遍!

💡 🤔 所以…我为啥要折腾这个?

我的目的超级简单:用最少的钱(最好是不花钱!),搞一套完全属于我自己的、全自动的AI学习小宝库!

而核心秘方,就是这个公式:

Cursor(Claude Code、gemini) + Chrome MCP + 开源工具 = 爽到飞起的本地知识库

这套组合拳的优势:

✅ 成本最低:无需为多个平台付费

✅ 无限制:文件大小不受限

✅ 学习成本低:一站式处理,从下载到分析

✅ 用最强的模型:Claude/Gemini的文本理解和分析能力超强

🔄 工作流对比

想想以前,我们是怎么干活的:

吭哧吭哧找链接 → 打开下载器 → 上传到某个死贵的平台 → 等啊等…… → 下载稿子 → 最后还要自己手动整理到眼花……我的天!

再看看现在,我怎么“偷懒”的:

丢一句话给AI → 喝口水,然后拿到一篇完美的逐字稿!

是的,就这么简单。

🤯 等等!这听起来是不是超级复杂?

NO!NO!NO!

恰恰相反!这简直是我用过最“傻瓜”的流程了!

整个过程几乎都是AI自己在那儿忙活

我们呢?像个大老板一样,偶尔指挥一下就行了。

说真的,只要你会用Cursor,你就已经100%能上手了!

🚀 Talk is cheap, show me the code!

光说不练假把式!我们直接来个现场教学!

昨天我看到“42章经”有一期非常顶级的播客:《关于AI Infra的一切 | 对谈阶跃星辰联创朱亦博》,内容很干,我们今天就拿它演示。

第一步:一句话,启动一切

我打开我的AI工具,敲了下面这行字

用chrome mcp,@博客链接  找到这个页面的音频源,并下载

然后……然后就没我啥事了!真的!AI自己就开始表演了!

1.找到音频源

AI 操控 Chrome MCP 插件,在网页的源代码里精准地找到了那个隐藏的音频文件地址。

2. 自动下载

找到地址后,AI 自动匹配了最合适的下载命令,直接在后台开始下载。

3.下载完成!

就一眨眼的功夫,一个56.4MB的高清音频文件,就乖乖地躺在我文件夹里了!

第二步:召唤 Whisper !

音频有了,下一步就是见证 AI 神奇的时刻!

这里,我们请出我们的超级英雄:OpenAI 的 Whisper!

你可以直接把它当成是“不要钱、随便用的通义听悟”!

它有啥优点?

* 免费!免费!还是免费! 重要的事情说三遍!

* 中文超溜! 识别率高到让你想给它磕一个!

* 超级贴心! 连标点符号都给你整得明明白白的!

我们还是一样,当个甩手掌柜,给AI下个命令:

安装openai Whisper,并转录 @播客文件.mp4

(如果你是第一次用,AI会先帮你把环境装好,一次安装,终身使用)

然后你就能看到AI开始吭哧吭哧地干活啦,下载模型、解决问题……

看着屏幕上滚动的代码,AI正在一个字一个字地把声音变成文字!

第三步:还没完!让AI给咱划重点!

三万多字的稿子到手了!但是……谁有空看啊!

别急!我们的目标是“知识”,不是“文字”!所以,最后一步,当然是让AI帮我们“读书”啦!

我把稿子往AI面前一扔,问:

@转译文本  这个音频讲了什么

AI“刷”的一下就读完了全文,然后把核心观点、关键信息、有趣细节,全都整理得漂漂亮亮地交给了我!

这效率,简直了!

以上的一切,还有更进阶的玩法,做一个 文字版工作流 + 内容提示词。

如果你需要,可以在评论区告诉我!

🎉 看看我们的最终战利品!

走完这一套流程,我几乎没费什么力气,就收获了以下成果:

1. 一份高清原始音频 (想听随时听!)

2. 一份三万多字的完整逐字稿 (细节狂魔的福音!)

3. 一份AI划好的重点笔记 (节省了我至少2个小时!)

4. 一个可以随时搜索的知识卡片 (这才是无价之宝!)

而且哦,这套玩法不光能搞播客,像什么会议录音、上课视频、采访记录……统统都能搞定!

✨ 最后的最后,聊几句心里话

说实话,这套 Chrome MCP + Whisper + Claude 的“神仙组合”,可能不是那种点一下就行的“傻瓜”方案

但它绝对是目前我心中,性价比、自由度和专业性都拉到最满的顶级方案!

它意味着:

* 零成本:跟大多数付费订阅彻底说拜拜!

* 高效率:让AI去干重复的活,我们只负责创意和思考!

* 超安全:所有东西都在你自己的电脑里,再也不用担心隐私泄露!

* 无限可能:你甚至可以自己动手,DIY出更强大的自动化流程!

希望今天这个小小的(但超级强大的!)工作流,能让你的AI之旅变得更有趣一点点!


好啦,今天的分享就到这里啦!

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI工作流 音频转文字 本地知识库 Whisper Cursor
相关文章