原创 金色传说大聪明 2025-06-20 20:49 北京
技术的尽头,是流程的融入
前几天,豆包上线了「AI 播客」
给一个PDF,或网址链接,就会生成一段播客(双人相声)
比如说,我的这篇月度总结《围城:模型困局、垂类竞速与 Agent 逐鹿|赛博月刊 2506》
可以听一下:产品非常好,效果非常不错
用了几次之后,我还是关掉了页面:我很难每天手动打开网站、传一份PDF,再坐那听
这让我想起一个更深层的问题:为什么很多优秀产品,最后进了收藏夹?
故事由此开始
00|AI 播客的悖论
先聊聊 AI 播客:NotebookLM 的播客功能爆火后,几乎每家大厂都在跟进,甚至很多创业公司都推出了类似产品技术门槛看起来不高,用户需求似乎也很明确:把文字内容,转成可听的播客
但奇怪的是,这么多团队做了这么久,AI 播客却一直没有真正火起来,背后的困局非常有趣。
第一重困局:时间错位
人什么时候会听播客?以我自己为例,临上飞机之前,还会缓存一批音频
类似的场景呢?通勤路上、跑步时、做家务时——这些时候,你根本没办法主动去生成一个播客
对于现有的 AI 播客,先有内容,再生成播客,这个流程,天然就是反人性的
当你有文章想听的时,你是在屏幕前的;当你想听播客的时,通常是离开屏幕后:这时候你没有内容可以转换
第二重困局:内容孤岛
每个播客产品,都想做闭环
你要在我的平台上传内容,在我的平台上生成,在我的平台上收听。
而用户的内容,则散落在各处,比如微信、邮件、PDF、网页、笔记软件...
用户很难为了听一个播客,把各种内容,从不同平台搬到你的产品。
除此之外,AI 播客产品之间无法互通。在 A 平台生成的播客,无法在 B 平台播放;在 C 平台整理的内容,无法在 D 平台转换每个产品,都在自建围墙
最后,用户要么不用,要么只能选择一个平台把所有内容都搬过去但搬运成本太高,大多数人选择了不用
第三重困局:习惯断层
用户听播客的习惯,很早之前就已经被 Spotify、Apple Podcasts、小宇宙这些平台深度绑定
从习惯的角度:大家会在通勤路上打开熟悉的播客app,看到订阅列表,点击最新一期
AI 播客呢?要求用户在想听播客的时候,先回忆起几天前生成的那个内容在哪里
同时,AI 生成的播客没有连续性传统播客有主播、有风格、有更新节奏,用户会形成订阅习惯
用户想看到的是比如「《屠龙之术》第114514期」
用户想不到的是“我昨天上传的那个PDF转的那个内容”没有品牌感,没有期待感,只是一个文件
这便是我看到的三重困局:时间错位、内容孤岛、习惯断层
所以呢?或许...播客要被嵌入到一个流程之中,而不是独立存在
01|The Information
再说个背景,我订阅了《The Information》,一个很棒的科技媒体付费刊物
我买了他们的 Pro ,折扣后 $799/年同时,但我却苦于没有时间去看
另一方面,豆包的 AI 播客功能恰好提供了另一种入口:只要投喂文字,就能生成“可听的内容”
灵机一动: 中间的人工步骤,能否省略?
于是,我魔改了豆包,让它多了个【The Infomation】
02|背后的思路:避免摩擦
在之前的流程里:
打开The Information →登录 →找到当天文章 →下载为PDF →上传至豆包 →点击生成 →播放播客
在这个链路中,每一步都不难:登录只需要几秒,下载PDF也就点个按钮,上传文件更是拖拽即可
但问题在于:当这些简单的步骤组合到一起后,用户行为就断了
对此,有个「微小摩擦力」理论:即使动机很强,如果执行的摩擦力过大,行为依然不会发生
真的,每天早上我需要主动打开两个网站,主动完成一系列操作,太难了
于是,这里写了一个脚本,搭配 Tampermonkey 插件,在豆包网页版加了一个绿色按钮:「The Information」
点击这个按钮,脚本会做几件事:
• 利用本地登录状态,从 The Information 拉取当天更新
• 将这些文章清洗、拼接成一个统一页面,部署到我的服务器
• 自动将链接投喂给豆包,触发“生成播客”操作
• 播客生成后,跳转回收听界面
然后就获得了这个
对了,邮猴的挂载流程是这样
整个流程被压缩成了:打开豆包 → 点一下绿色按钮 → 播客自动生成 → 开始听
03|从工具到嵌点
这个小改造,让我开始思考另一个问题
有没有一种形式,可以:在不打扰用户前提下,让 AI 与人协作?
现在的 AI 产品,很多会强调自己有多智能、多全能:
我能做 PPT、我能发小红书、我能剪视频...反正我都可以,都用我
但用户的真实状态呢?是忙碌的、健忘的、有惯性的
AI 真正需要的,只是一个按钮、一次默认行为,就能触发它做完一件不需要人主动决策的事
亦或许,豆包提供的,除了“AI 助手”外,还可以是一系列「嵌点」
对于嵌点,想想这些:
• 二维码之于支付:不需要你记住复杂的操作流程,只需要在该付钱的地方,扫一下码
• 划词之于翻译:你不需要复制文本、打开翻译软件、粘贴、点击翻译。只需要选中文字,翻译就出现了
• 浏览器插件之于浏览器:你不需要离开当前页面,功能就嵌入在你需要的地方
这些成功交互,形态都有一个共同特征:并非独立存在的,而是嵌入用户路径之中
对了,「嵌点」这个词没听过?没关系,我现编的
04|AI 要顺手
用户不会主动想起用 AI
这句话可能有点扎心,但这是事实:是很多时候,我们用 AI 的路径并不顺
为什么会这样?人类是路径依赖的生物
我们的大脑为了节省能量,会形成各种习惯回路
这并不是坏事,对于经验和刻板印象的依赖,会帮助我们节省太多的精力,比如:
• 挑餐厅的时候,选人多的,大概率比较新鲜好吃
• 看到赛博禅心推送的时候,总认为是最好、最新的内容(bushi
这种依赖一旦形成,再想改变,就需要极大的推动力
你看,很多人还在用 Windows XP,或者 Word 2003
改变,需要认知成本,也需要行为成本
每一个新学的东西,都是对既有记忆的背叛
AI 同样也是如此:即便能力再强,如果接不进流程,也没有用武之地
想象这样的场景,读一篇英文内容,遇到了专业术语
• 传统流程:复制术语 → 打开翻译软件 → 粘贴 → 看结果 → 切回论文
• 理想流程:鼠标悬停,解释自动出现
差别在哪?后者没有打断你的阅读流程,结构能插得上,比功能是否足够强更重要
再想一想很多公司,都有所谓的内部交流工具,功能异常齐全。但还是拦不住大家用微信
为什么?微信已经是人们生活的一部分,切换成本太高,难以推动
05|利用嵌点
大多数产品,并不缺界面,而缺嵌点
我们每天使用的产品中,充满了“未被使用的触发位”
这些位置就像城市中的黄金地段,位置绝佳,人流量大,但还没有被合理开发,让我们看看这些潜在的嵌点:
报告页面的顶部
• 现状:通常只有标题和日期
• 可能:一键生成的执行摘要,让忙碌的管理者30秒内抓住要点
邮件阅读完之后
• 现状:只有"回复"、"转发"按钮
• 可能:AI自动提炼的要点归纳,标注出需要你action的事项
协作文档的侧边栏
• 现状:大片空白或者广告
• 可能:"自动配图"按钮,让你的文档瞬间图文并茂
视频播放器的进度条
• 现状:只能拖动进度
• 可能:智能章节划分,直接跳转到你关心的部分
这些位置原本就存在,也被频繁触达,但还没有接入 AI:各位产品经理,可以把功能挂上去
这就像是 Twitter 的翻译功能
在这个功能没有之前,你得把 Twitter 内容复制出来、打开翻译软件、粘贴、看译文...然后...你忘了它讲啥
而现在?一个小小的"翻译推文"按钮,让全球信息的流通变得无比顺畅
这就是嵌点的力量
而豆包呢?也可以成为能力提供者,把AI能力嵌入到各种产品的关键节点上
06|Less is More
很多产品会强调:能做什么另一个问题也该被思考:何时出现
产品经理会假设:用户会主动来找AI
在现实之中:用户总在正忙自己的事,才不管你 AI
电力改变了人类文明,并嵌入到了每个地方:墙上的插座、手中的充电器、街边的路灯...到处都是电我们使用电力时,想的不是“我在用电”,而是“我要开空调”、“我要给手机充电”
同样的还有互联网:小时候,我们会说“去上网”,但现在没人说了,因为我们时刻都在网上
最好的AI,是你意识不到的AI
它不应该试图替代你正在使用的工具,而是让既有工具变得更好用它不应该改变你的工作流程,而应该让你的工作流程更顺畅
而豆包一类的软件,或许会成为一个这样的 AI Hub
• 在邮件客户端里,它是智能摘要
• 在浏览器里,它是一键播客
• 在文档编辑器里,它是写作助手
• ...
用户需要的,只是无微不至的服务
回到那个绿色按钮:当豆包的 AI 播客,通过一个简单的按钮融入到日常浏览中时,它便活了
技术的价值,不仅在于先进,而在于它能自然融入当技术隐身之后,才是它的魅力时刻