孔某人 2025-05-10 00:59 广东
新的产品让人类反思自己。
原标题: The AI wearables are always listening
url: https://www.youtube.com/watch?v=x0vgM_xtlno
date: 20250506
本文是Vergecast播客在2025.5.6讨论Bee这个全天随身录音设备的播客文稿中文全文,文字经过凝练以降低阅读成本。
这个播客后面还包含其他话题,只节选了讨论随身录音设备Bee的第一部分。Bee产品:www.bee.computer
孔某人评论
现在海外的随身录音设备不少了,大家对那种“便携录音笔”模式的产品,即需要时才录制的产品,已经相对熟悉。争议点也是明确的。
但真正意义上的全天随身录音设备是另一种模式,它是默认全天开启的。虽然只是录制时间的差异,但使用体验是很不同的,按需录制产品的一些小问题在这里被显著地放大了。大部分人如果没有看完本文后面的播客文稿,大概很难想象,估计即使看完了也很难想象。想要体验这种感觉,大概就是去买一个这类产品用用,或者是找一个固定式的录音设备,在一个固定的位置长时间录制,然后看下录制的内容。
生活中的很多事情其实并不值得被记录,或者是并不值得被再次总结和让用户确认。我个人是赞同这个的,所以单纯从我的信息记录需求来说,我很少使用这种录音设备,更很少去再看其中的内容。我组的一些社群交流线上会议也默认不会开录制,特别是发言者没有事先准备的情况下。并不是我讨厌录音,而是我知道这里的绝大部分没有用,(而录制本身却可能给发言者带来问题)。我觉得有价值的事情我会进行手工记录,在会后,或者会中,而这种情况很少。
当然我并不觉得这种产品没有价值,我觉得它更像是浏览器的历史记录一样,可以记录,但只在需要的时候才去查阅。而以完备性、准确性的目的,让人自己审核自己一天录制各种信息,对用户来说是比较反人性的。我自己是个记账超过10年的人,而我到现在也没有当面遇到另一个能够坚持跟我一样记账的人。记账一天记不了几笔,绝大多数人都不会去做,而审核自己一天的录制的信息远比这要麻烦。
在一天结束时,回顾自己的一天是个不少人会接受的功能,但这不是以准确还原为目的的。一天之后,应该回顾自己的成功、欢喜等等美好的经历,这有着不错的情绪价值。而不是说:“你今天拉肚子了”,“你今天出门忘带东西了,下次要注意”……这很准确,但这不是人性想要的。
不管怎么样,语音设备由于技术的成熟会不断地普及。而如何重新认知这类产品、如何重新认知自己的信息搜集习惯……则是交给人类考虑的问题。
这个播客最后说的很好,这个事情最终回归到人类生活的意义。别人以为的小事,可能是你自己想珍藏的宝贵记忆,反之亦然。
正文
00:02:08
David Pierce:
我觉得我要戴上这个,因为我现在已经在用两种方式录制了,现在我要用第三种方式录制我们,就用这个挂在我脖子上的奇怪项链。我们该如何描述这些设备呢?我们想谈论的是,我称之为AI语音记录器,这样合理吗?
Victoria Song:
我认为AI语音记录器是合理的,或者像Bee描述的那样,是你的AI记忆。这是他们最终想要达到的目标。所以AI记忆可穿戴设备是他们想要成为的高级定位,但目前本质上它们就是AI语音记录器。
David Pierce:
是的,它们都是同一事物的不同变体,基本上是一种专用设备,主要是某种可穿戴麦克风。它的理念是记录事物,记录多少事物以及何时记录。我认为这很有趣,我们应该讨论一下。它被设计成一种易于使用的记录器,然后使用AI模型来总结你日常生活中发生的事情,或者让你搜索这些内容,或者提取行动项目。它们都有略微不同版本的相同理念,但感觉都是大致相同的理念。这样描述合理吗?
Victoria Song:
是的,就像你口袋里有一个AI速记员,它会告诉你说了什么,给你提供生活的文字记录。然后有时,根据设备的不同,它会根据你随口说的话给你提供行动项目,而这些话你十有八九会忘记记下来。
David Pierce:
是的,我真的很喜欢这个描述,因为如果你只是这样想,它听起来很吸引人,对吧?记录下你需要记录的所有事情,包括你忘记写下的所有事情。我的大脑立刻就会说,是的,我确实想要那个,那对我会很有用。然而我的体验却非常不同。你特别使用Bee很长时间了,所以让我们从那里开始。告诉我一些关于日常佩戴Bee的情况。
Victoria Song:
Bee的营销是你将记忆外包给AI。你可以用两种方式佩戴它,可以作为一个小型类似健身追踪器的手环,或者作为一个别针。我的手腕空间有限,所以我大部分时间选择将它作为别针佩戴。它只是记录你所有的对话。
David Pierce:
这是一种你应该全天24小时佩戴的设备,对吧?晚上充电,白天佩戴?
Victoria Song:
它有七天的电池寿命,所以你甚至不需要每晚充电。每七天充电一次,整周佩戴,就是一直佩戴。它目前的功能是这样的,他们有一些更大的想法,但我们还没有达到那个阶段。但现在,你基本上会得到你生活的文字记录,你一天的摘要,像小型AI日记条目记录你的一天如何,值得注意的时刻,基于所说内容的AI待办事项建议。
它还为我的生活写了非常有趣的同人小说。有一个小部分叫做事实审查,我称之为AI事实Tinder,因为你基本上是对它在你一天中了解到的假设进行左右滑动。这应该有助于它学习额外的上下文。它可能是一些平凡的事情,比如"Victoria有一个客厅和厨房",这是它给我的一个实际事实。然后另一个是"Victoria有一个叫Kendrick Lamar的朋友,他喜欢芥末和关掉电视",这是因为它无法解释Kendrick Lamar的《TV Off》歌词。
然后你会得到一些平凡的事实,但你会想"这从未发生过",比如"Victoria有...",我忘了确切内容,但是关于我的饮食限制和棒棒糖的什么内容。我想,我没有谈论过棒棒糖。不过现在回想起来,它是不是在想我谈论Olipop饮料?我不知道。所以你只是不断地审查这些事实Tinder,看着它们想,"我从来没有谈论过棒棒糖,它在说什么?"
00:07:01
David Pierce:
我戴着这个设备时有一种很奇怪的体验,即使是在那些不知道我戴着它的人面前,尽管他们的生活并没有因此而有任何不同。我感觉很奇怪,就像你在为FBI工作戴着窃听器一样,你总是会意识到自己正在进行的对话。我用这个设备已经有一段时间了,但这种感觉一直没有消失。你也有这种感觉吗?
Victoria Song:
我开始在日常生活中说话变少了。我本来就不是那种经常自言自语的人,但偶尔我会说"糟糕"之类的话。我现在完全不这么做了,因为有一次在洗手间发生了一个肠胃问题,我说了些什么,它把内容总结了出来,我觉得这太无礼了。然后它还建议我再次开始服用Lactaid,我想说我不需要这个。
关于我生活中的人对此的感受,我就直接引用我配偶的话吧。他们说:"这个设备不够强大或有用,不值得持续侵犯我的隐私。"因为作为一个使用AI记忆工具的人,你能记得在不适当的对话中按下静音键吗?比如,如果你正在吵架,而这场争吵突然爆发,因为也许你的表亲打电话给你,想要解决你们已经争论了三年的问题。
David Pierce:
我要说这纯粹是假设性的。
Victoria Song:
是的,纯粹是假设性的。当你因为彼此之间长期积累的怨恨而大喊大叫时,你会记得按静音键吗?不,你不会。你只会沉浸在那一刻的争吵中,然后你会在之后看到一份记录,想着"太好了,我可以重温这个紧张时刻",因为它通过你的语音和对话内容分析你的情绪。
有一次它说:"Victoria与她的表亲进行了一次紧张的对话",因为我表亲有个韩国名字,他们把名字弄错了。所以听起来好像我在和Bee Gees乐队吵架,这很搞笑。所以问题是,我想要意识到这一点吗?这个记录是否帮助我成为更宽容的人并从这场争论中走出来?也不是。所以这很奇怪。
我经常忘记在办公室或通勤时关闭这个设备。这导致我收到一些无用的待办事项,比如提醒我去查看路易斯安那州有可能伤害他人的病人。我当时想,这根本不是我的病人。那是新泽西公交车上某个人在看医疗剧或者公开讨论病人隐私,这太疯狂了。这个设备完全无法区分电视节目和真实对话。所以,在看《Severance》这季时忘记静音这个AI记忆设备挺有趣的。
David Pierce:
等等,我能给你读一个我的例子吗?出于好奇,我测试这个设备时把音量调高,然后看了15分钟的TikTok,想看看它会做什么。我来读一下它对TikTok的总结:讲述与孩子度过的不眠之夜(这是我看的一个TikTok)、一段令人困惑的交流、另一段令人困惑的交流、讨论耳机和音乐课、随机想法和观察、西班牙语对话和烹饪、高尔夫评论、音乐间奏、等待不会来的人、玩游戏和阻止毒贩。
Victoria Song:
TikTok,确实如此。
David Pierce:
这对我来说很有启发,因为它实际上提取的个别内容还算不错。如果我坐在这里播放音频或进行对话,我主要使用的Limitless吊坠和Rewind设备(一个是附在手机上的东西,另一个是挂在挂绳上的别针)都能相当好地总结对话中的信息。但它们完全不了解现实生活是什么样的。这让我意识到这类技术的门槛有多高。比如你提到的,什么是重要的,什么是我想记住的,什么是我宁愿永远不再想起的,什么是完全不重要应该直接丢弃的。这些设备理解一个人如何度过生活的门槛太高了。而且所有这些AI技术,在你做到这一点之前,没有一个能以任何有意义的方式工作,这很困难。
Victoria Song:
确实很困难。而且作为必须审查这些内容的人,你经常感到情感和精神上被操控,你成了自己生活的事实核查员。你查看这些记录和总结,因为这个AI设备非常注重总结你一天发生的事情。我会想,听着,我从来没有告诉我的老板Todd关于我的排便情况,我死也不会这么做,这会引发HR投诉。但它说我在公共社交媒体平台上谈论了我的排便情况,然后我们在一对一会议中笑了起来。我想说,不,这根本不是事实。人类记忆可能有缺陷,但我绝不会那样做。它不理解幽默,不理解即兴发挥,不理解你在听音乐时的情况。我看了几集《Abbott Elementary》第三季,它给我发了待办事项说要注意SEPTA罢工,因为这会影响我的学生上课。我想说,我不是费城的公立学校老师。它也有用处。我录制了一些作为记者的简报,它能够提炼出一些事实,如定价、发布日期、总体理念和概念。虽然产品名称完全错了,但那是次要的。
David Pierce:
这对我来说很有趣,因为我认为目前这些设备最合理的用例是将它们用作有目的的录音机。比如我现在戴的Limitless,你可以整天使用,但他们更具体地将其定位为:我坐下来与某人开会,打开它录制,然后得到一些总结的行动项目。这很好,实际上AI在这种事情上相当不错。如果你只是说,这里有20分钟的音频,从中提取最重要的内容,很多模型都能做得相当好。但这种功能已经极度商品化了。如果我给你20分钟的音频,让你用AI提取行动项目,有100个地方可以做到,质量都差不多是B-级别。对我来说,这种专用设备只有在你将其作为一种始终开启的可穿戴设备时才有意义。比如《Abbott Elementary》的例子很有趣,我希望这种设备能为我做的一件事是保留我观看的所有节目的列表。每年我都会读Steven Soderbergh的博客,他每天记录看了多少集节目和电影,然后在年底发布。我总是想,那太酷了,我应该保留这样的记录。这个设备应该为我做这件事。它应该能听到内容,就像Shazam一样,它应该能告诉我我听过的所有歌曲,看过的所有节目,它应该给我一个今天我笑过的所有TikTok的汇编。这是你真正能从中获得一些价值的功能。但这些设备都远远无法实现这样的功能。它们都像是,你应该知道你大声说出的每一个词,因为那很有价值。也许我只是个无聊的人,但这真的一点也不重要,这是我的经验。
00:15:10
Victoria Song:
你会意识到一天中进行的对话范围有多广,因为这个设备不会记录你的无声对话,比如短信、邮件和Slack消息。不过,Bee确实有一些邮件集成功能,会总结你需要从邮件中处理的事项,这可能很有用。但有一次它提示我收到了ParkMobile集体诉讼案的通知,还给了我ID号码。我搜索了4个不同的邮箱,却找不到这封邮件,开始怀疑它是否凭空捏造了这封邮件。对我来说,这是一个真实的集体诉讼案,有真实的截止日期,但我在任何收件箱中都找不到这封邮件,这让我陷入了存在主义危机。
另外,它无法区分一些情况,比如我在Stylevana购物网站囤积韩国防晒产品。这个网站总是在打折,但AI会提示"你需要利用Stylevana的最后一分钟特卖",而实际上两天后就会有新的促销活动,它无法区分这一点。
这个概念很吸引人,因为我们生活中确实有很多杂乱信息,需要筛选和记忆重要的内容。但同时,我与远方朋友通过短信进行的深入而有意义的对话并不会被记录在应用中,因为这些对话不是口头进行的。这就像"如果森林里的树倒下而没人听见,它是否发出了声音"的问题——如果对话不是口头进行的,你的AI记忆是否知道它发生过?除非你授权它与消息应用集成,但那感觉很不舒服。
我认为人们通过佩戴这些设备能学到的最有趣的事情是,你一天中实际说出口的内容是什么,以及保持沉默的价值是什么。我发现你白天真的不必说任何话,但这样你的记录就会变得非常无聊。
David Pierce:
是的,很有趣。你会发现自己说话变少了。而我发现自己又开始说得更多。我意识到我戴着麦克风,当我做一些我的记录器不知道的事情时,我会特意说出来。昨晚我甚至发现自己在玩电子游戏时自言自语,因为我想让这个设备知道我在玩游戏,作为某种记录。就好像我在做某事,而这个我信任能了解我的设备却完全不知情。
Victoria Song:
我认为人类普遍都有记录发生事情的冲动,尤其是媒体从业者和成为记者、作家的人。我也在某种程度上这样做。我热衷于记日记,每天都会写下3到4个我认为值得记忆的事情。将这些与Bee认为值得记忆的事情进行比较非常有趣。
有一次,我注意到它没有捕捉到的一件事:我们与Eater共享办公室,他们举办了帕丁顿日活动,办公室里有橘子酱三明治和茶点。我非常喜欢其中一种饼干,这是一种思维转变的体验,但我是在安静中吃的饼干,安静地思考,周围没有人可以分享那一刻。所以我只是在我的小日记本上记下来:"这个草莓蛋糕饼干太棒了。"但这在AI记录中根本没有。我现在看到其他饼干时仍会想起这个草莓饼干,可见它对我影响有多大,但在我的AI生活记录中却没有任何记录。
佩戴这种设备时,你始终在处理同意问题。我有些朋友会说:"她又在搞那些事了,随便吧,告诉我AI怎么评价我。"但也有人不想被记录。比如我的配偶在某种程度上是一个有意识的技术排斥者,这让我保持理智和健康。但这也在我家里造成了摩擦,因为他会问:"它在听吗?你能把它关掉吗?"这是另一个你必须学会处理的问题,尤其是当你进行关于家庭财务的紧张对话,或者你们俩一起批评朋友圈中做出一些值得怀疑的生活决定的朋友时。你想要记录这些吗?
如果你是医生,这与HIPAA有什么关系?这对你来说是否合乎道德,即使作为医生,你可能想要记录某些事情来思考?Bee的人告诉我:"哦,是的,律师、教授都在用。"我想,律师绝对不应该戴这个,因为你处理的是敏感事项。所以即使在专业环境中,这样做是否合乎道德?我们是否需要一直记录所有内容?
模拟录音机最酷的地方在于,作为模拟设备,数据不会被上传到云服务器。当你长时间佩戴这些设备时,你会开始思考存在主义危机和人们的行为方式。因为如果你要道德、负责任地使用它,你需要在朋友聚餐开始时说:"嘿,我正在测试这个AI设备,你们都同意吗?你们都没问题吗?"
00:21:07
David Pierce:
撇开伦理问题不谈,在很多州这也是违法的。如果你在需要双方同意的州,对他人这样做实际上是在犯罪。这些事情很复杂。我认为最大的挑战是这些设备默认开启的状态。不过我其实支持AI语音记录器的理念。我已经开始使用一些这样的工具来记录日常思考,让它为我整理出一天的大纲,这很棒。但认为我应该能够随时随地记录生活并且这会有用,我同意你刚才提到的你配偶的观点,也许这里面有些价值,但目前还远不够好,不值得承担其他所有的奇怪之处和代价。昨晚我打了一个非常私人的长电话,当时我戴着这个设备却完全忘记了它的存在。它已经开了好几个小时,我根本没想到这一点。今早打开应用时,整个通话记录,至少是我这边的对话,全都显示在应用里,这意味着它被上传到了某人的服务器上。所有这些公司都有非常严格的隐私政策,我相信他们关心隐私,但那个私人对话现在已经不再私密了。我不仅对自己这样做,还对电话那头不知情的人这样做,对我在地铁上站在旁边听到对话的所有陌生人这样做。这改变了作为一个人在世界上存在的本质。我们已经以一种非常有趣的方式解决了相机的问题,但这是完全不同层次的事情,因为我至少能看到你在用相机对着我。雷朋眼镜之类的设备让事情变得复杂,但如果相机能看到我,我大概也能看到它。这些语音设备不同,它们让我感到害怕。
Victoria Song:
这些设备完全不同。这支笔听到并记录下来的对话令人担忧。它记录了我们同事谈论其他部门视频的片段,这些是我本不该知道但却被记录下来的内容。这真的让我感到某种程度的偏执,就像你永远不知道谁在听。在互联网早期,有个网站叫"Overheard in New York",上面都是人们偶然听到并上传的对话片段。这在某种程度上还可以接受,因为它是匿名的,不会描述这些人是谁。但这些AI设备不同,它们会捕捉名字、项目内容。它记录了Vox Media办公室里两个人在二月某天谈论大型猫科动物和保护区的对话,我本不该知道这些,但我听到了,而他们不知道我知道了。你就带着这些知识,感受它有多么庞大,以及你对某人做了这种事后有多么不舒服,无论多少披露都无法让你感觉完全正确。你感觉自己像个间谍。这是向这些AI可穿戴设备的奇怪过渡,比如能录像的智能眼镜,能听取一切的AI记录器。我正在配一副Nuance音频眼镜,可以增强听力。LensCrafters的女士对我说:"哦,所以你要注册我们最新的间谍工具。你将听到一切。"我当时想:"什么?天啊,我现在是在做间谍工作吗?"这在某种程度上很可怕,因为我认为自己是一个深入思考伦理问题的人,但我知道有些人不是这样的。
00:25:08
David Pierce:
你认为这种设备有适合你的版本吗?撇开我们作为经常需要记录与人交流的记者这个特殊用例不谈,大多数人并不需要整天记录这类内容,但很多人确实有会议、需要记住课堂内容等场景。有没有一种在伦理方法或使用方式上的转变,能让你对这些设备感觉更好?
Victoria Song:
我认为如果它只能听到并识别我的声音就好了。我最初被吸引的功能是待办事项提醒。我经常答应做各种事情,但只记下了大约70%,这意味着30%的情况下别人需要来问我是否完成了任务。我是个非常健忘的人。但这类设备需要权衡什么值得记住,什么重要到需要被遗忘,因为遗忘也是一种情感上的生存机制。而AI的态度是"我会记住一切",这是不对的。
David Pierce:
是的,在开始测试前,我以为一天中大概有50%的内容值得记录,即使只针对我自己的声音。有些内容有趣且重要,有些则可以丢弃。但实际上,大概只有5%重要,95%可以丢弃。我认为这些设备的真正价值在于主动丢弃正确的95%内容,但这是个技术难题。所以这些产品不愿冒险做这种假设,因为如果判断错误,整个产品价值就会被摧毁。它们宁愿过度分享所有内容,以确保你能找到你需要的那一条。
Victoria Song:
这给你带来了很多额外工作。从哲学角度讲,人类使命的一部分是决定什么在自己生活中重要。我们已经投入了数百万小时思考这个问题的正确答案。期望AI在情感智能尚不成熟的情况下能做到这一点有点荒谬。我们总是讨论AI有多聪明,却从不讨论AI是否有智慧。我需要AI有一点智慧才能帮助我,因为这才是我真正寻找的。也许我需要的不是助手,而是指引我方向的Mr. Miyagi。但一个AI版的Mr. Miyagi比我们现在准备承认的要难得多。
(“Mr. Miyagi”是1984年经典电影《小子难缠》(The Karate Kid)系列中的虚构人物——宫城成义(Nariyoshi Keisuke Miyagi)。他是主角 Daniel LaRusso 的空手道师父与人生导师,凭借“Wax on, wax off”等寓教于修的训练方式和富含东方哲理的金句,成为“睿智导师” archetype 的代表人物。)
David Pierce:
好的,我想在结束前分享发生在我身上最棒的事。今早,我两岁的儿子从凌晨三点就醒了,所以我整个早上都戴着这个设备。以下是Limitless应用描述的我们一天的片段:"去游乐场并观察垃圾车,建议去游乐场,指出垃圾车,表达惊叹,再次识别垃圾车,讨论去游乐场,识别垃圾车"。这非常准确地描述了我的早晨。它可以播放我儿子指着垃圾车大喊"垃圾车"的音频,这很棒。如果它只给我这个,忘掉其他所有内容,只给我儿子反复说"垃圾车"的录音,我会付费并且很满意。这是我使用任何AI产品最好的体验,就是能看到我儿子喊"垃圾车"的录音。
Victoria Song:
垃圾车,是的。
David Pierce:
就是这样,这就是AI应该做的。
Victoria Song:
这就是我们需要的全部。
交流与合作
如果希望和我交流讨论,或参与相关的讨论群,或者建立合作,请加微信,联系方式请点击 -> 专栏简介 及 联系方式 2024。
本文于2025.5.10 首发于微信公众号