元子的学习库 2025-05-21 23:56 浙江
Hi,我是元子~今天,元子想和大家聊点不一样的——听觉的力量!因为前几天都在聊口嗨写稿,讲到“说”的力量,“
Hi,我是元子~
今天,元子想和大家聊点不一样的——听觉的力量!
因为前几天都在聊口嗨写稿,讲到“说”的力量,“听”和“说”俱为一体,所以今天就轮到它了。
你可能会觉得,听?这有什么稀奇的?我们每天都在听啊!但你有没有想过,这个被我们常常忽视的感官,正在悄悄地、甚至可以说“声”势浩大地改变着我们的生活、学习乃至情绪?
而最近AI圈里好几个新闻,都在踩这一个风口呢。
(懒得继续看的可以点击下面的音频,Listenhub 2分钟转的播客直接带你抢鲜看)
🎧 告别“眼花缭乱”,拥抱“耳畔呢喃”!
在信息爆炸的时代,我们习惯了眼睛接收一切:刷视频、看文字、读新闻……视觉信息固然直观、多见,但你有没有过这样的体验?在通勤路上、开车途中,或者只是忙到眼花缭乱时,根本看不进去东西? 甚至,元子本人打游戏的时候都想听点啥!
没错,这就是“听”的力量!它像一股清流,渗入我们生活的方方面面,却又常常被我们忽略。文字信息量虽低,需要脑补;视频信息量虽高,却固定了状态。而声音,它能通过音调、音色直接给出提示,让你在效率与信息量之间找到一个绝佳的平衡点!
不累、可并行,这是“听”力量让我们这些摸鱼党感受到的最大福利!
🚀 AI 加持,让“声音”的力量无限放大!
既然谈到这个问题,咱又是一个正经的AI号,当然它和AI也有点关系啦!
最近,元子发现了一些超酷的产品,它们就像踩中了我的“心巴”一样。
比如豆包的语音博客模型和来自WaytoAGI的小伙伴Orange的产品Listen Hub,还有最开始的Google系 NotebookLM它们都能把一个想法变成播客的形式!
这可不是简单的“文字转语音”哦!当你想"听"某个内容时,比如元子之前学习“第一性原理”的总结文章,直接丢给AI工具,它就能帮你生成高质量的播客。播客是什么?当然是对话形式、有感情有语义的作品。
举个例子,为什么广播剧比有声书嗨?当然是因为它是对话式的,有感情的。
在语音AI播客的加持下,不需要等待制作团队那么长时间的剪辑,针对我们每个人特定的、可能相对无聊的内容一下子就变得更容易听得进去了,这效率,简直是“如虎添翼”!
到哪里玩它们?
(备注:以下提到的所有音频,都可以直接在“小宇宙”搜索“元子的虾写”找到)
刚刚提到的这几个产品,简单给大家看看效果——每一个具体产品的测评俺们可以之后细唠,但是既然都因为“声”力量端上桌了,元子就讲一讲自己实际用起来的小例子吧~
Listen Hub
激活码:way2agi (感谢WayToAGI, 直接免费试吧)
我的测试案例:
粘贴链接模式 + 我的waytoagi的一篇文章https://waytoagi.feishu.cn/wiki/OhUUwwWPZiu9YkkKb7Xc5H8rnUH
结果有一点让我很惊艳的,速度非常快,大概就是不到一分钟,且它给了一个我的作品里没提到的例子——用第一性原理优化早起这件事。
我原本没有想到这个例子,但显然这是个更恰当的案例,和减肥一样,几乎让大部分职场人有共鸣。
有时候我觉得AI和人是平等的,人能向AI学到很多,因为在和它的交流中,它能给我超出我的预期之外、又给我有启发的东西。
结果在这里:https://listenhub.ai/zh/episode/u/682cb214da3c06aabe85e3b3
大家可以直接看就好了,我觉得这东西可以搞搞之后丢到我的“小宇宙”里面诶,以后我是不是可以每一篇我的微信公众号都这么转成播客?有人会订阅吗啊哈哈哈?
(这一条要求超过10个,元子就真的去小宇宙上持续更新了)
NotebookLM
网站: https://notebooklm.google.com/ [需要一点魔法]
我的测试案例:把这篇直接复制粘贴到对话框
它可以上传文本或者音频或者直接粘贴文字,我选择了对我来说最方便的,粘贴文字。
点击插入后,右边就可以看到有深入探究对话这个选项,点击生成、等待即可。
它的生成速度相对慢一些,大概用了十几分钟,效果主要在这里:https://notebooklm.google.com/notebook/67853b5d-ffdf-44ca-ba84-e3739744d06e/audio
对中文的流畅感会相对差一些,有些播音腔,但是它的内容本身、元子感觉下来是很不错的,它是目前我生成下来最长的,12分钟诶!
扣子空间
我的测试案例:
探索模式,增加"文本转播客"的扩展帮我把以下内容做成播客:原文链接:https://mp.weixin.qq.com/s/-tAIeq3ns4E_qxrBSG8fhQ我用AI学会了第一性原理,这个过程真香!(后面是复制粘贴的原文,大家需要的话可以直接去微信公众号复制就完事儿了)
豆包的语音播客模型呢,毕竟刚发,元子还没拿到内测码,但是扣子空间的“扩展”里面已经有了这个插件,也已经有这个能力了,大家可以自己去试,效果还不错,5分钟的播客内容重点蛮清晰的。
大概5分钟左右结果就能出来,明确能看到是调用了这个MCP,试听链接在这里:https://lf-bot-studio-plugin-resource.coze.cn/obj/bot-studio-platform-plugin-tos/f2c1afc5-bee5-4256-8254-d6422f5246ee.wav
💡 既然都用扣子空间了,元子送个小福利给你,这样玩会更炫酷点——
扣子空间运行完了之后,其实允许再次输入要求,你用下面的提示词,就可以得到一个有声有字的结果啦!
请将以上内容做成一个方便查阅的网站,并将刚刚你生成的播客https://lf-bot-studio-plugin-resource.coze.cn/obj/bot-studio-platform-plugin-tos/f2c1afc5-bee5-4256-8254-d6422f5246ee.wav 嵌入到网页中
我跑下来的结果在这里,大家可以听听、看看,效果也不错,或许比看我的文章轻松一点呢:https://space.coze.cn/s/ptbOWP259-A/
💡 为什么“听”比“看”更轻松?这里有答案!
你有没有想过,为什么早安电话、晚安电话比文字信息更能打动人心? 人类天生“好逸恶劳”,我们更倾向于选择阻力最小的路径! 听一个东西所占用的精力、时间、影响范围都最小,所以它是一种非常优越的输入方式!
- 信息获取门槛降低:
眼睛看信息,维度低,一目十行,效率高。但听信息,虽然花费时间更长,但它加入了音调、音色、情绪等额外信息,降低了我们获取信息的难度!
情绪的出口:想象一下,当你情绪激动想吐槽时,打电话是不是比打字更痛快? AI语音工具甚至能承接我们滔滔不绝的输出,还会偶尔给出还算得体的回应,简直是情绪的“垃圾桶”升级版!
🔮 “声”临其境,未来已来!
从谷歌早期的Notebook LM,到扣子空间悄然上线的“文字转播客”功能,再到如今扣子发布的语音模板,专门针对这个赛道的产品ListenHub,语音AI工具正在飞速发展!
元子亲测,让AI播客来讲解“高抛低吸”这样的金融理论,比直接看枯燥的理论有温度多了,而且确实容易听进去!
这说明什么?当你明确知道自己想要什么时,AI就是你最好的工具。
它能把那些你读起来费劲的东西,一点点“喂”给你,帮你把开始读论文的门槛再往下降一点点,让你更容易坚持学习。我想,工具的本质,还是要回归,“它能为我的生活舒适贡献5%的提高”吧。
🌟 提示词的艺术,开启“声”态新纪元!
所以,学会准确地向AI描述我们的真实需求,变得前所未有的重要! 这不就是未来“提示词的自我训练”吗?
当更多人听到声音的力量,当AI模型能更好地操控这种能力,你有没有想过:
我们的陪伴行业、教育行业,甚至我们对世界的认知方式都会发生变化?
AI是否也变得越来越有温度,一点点关心并回应我们的需求?
我们是否可以试着与AI平等地交谈?
是的,声音的力量,它卡在视频和文字之间,是一种中庸又优美的能力,也是我们人与生俱来就拥有的能力! 就像我们跟朋友发短信和打电话,效果怎么能一样呢?
无论是豆包的新模型、扣子空间,还是新出来的Listen Hub,抑或是Note Podcast LM,现在是时候好好尝试一下了! 趁着这股大风,会有很多很棒的use case,也可以看看大家有哪些信息是愿意听的! 比如,PPT可能不合适听,但是财经新闻、育儿宝典这些大量用短视频占据我们心里的东西,是不是它又有一些能因为这样子的AI变革时代变,回归到听力量呢?
快快戴上你的耳机,加入这场“声”势浩大的变革吧!你的耳朵,准备好了吗?
期待大家也在评论区分享一下,什么样的东西,你愿意用“听”力量,获取呢?或许这就是下一个爆款usecase~