Mars任鑫 2024-04-15 18:53 上海
什么叫反共识?反共识就是听起来不太对的东西,但是却可以帮助大家更广阔的打开一下思路,就像“ 精神病人思路广,弱智儿童欢乐多嘛 ”。
今天我们来讲 AI 产品设计。
一般来讲 AI 产品设计,肯定会讲你要理解用户、要理解 AI 设计的原则 ABCD,然后讲一通很有道理的话。
今天不讲这些,只讲 12 条反共识。
文章有点长,大家可以收藏起来慢慢看,也可以移步到 「AI 炼金术」的播客节目,来听??
什么叫反共识?反共识就是听起来不太对的东西,因为我相信大家听那种一听就觉得好有道理的话已经听很多了。所以,今天我们来讲一些听起来没有那么有道理的话,这也是我们自己在产品设计和孵化器的运作过程当中,经常给项目分享的一些看问题的方式,听起来都不太对,但是却可以帮助大家更广阔的打开一下思路,就像“ 精神病人思路广,弱智儿童欢乐多嘛 ”。
所以,大家可以听一听我的一些谬论,虽然有些在公众号和播客上聊过,但是大家可以听一下这 12 条里面有没有可以让你一听,就觉得这肯定是错的呀!如果你觉得它肯定是错的,然后我又讲的有一点点道理,那可能就可以激发你发现一块思考的盲区,可以过去想想,很有可能我真是错的,对吧?但是如果万一不是的话,可能就打开了一片新的天地。
①
CUI 不见得是好事儿
那么第一个反共识呢?就是跟大家讲一讲自然语言的交互界面,不见得是一件好事。可能有的时候我们管自然语言界面叫 CUI ( Conversation User Interface,),有的时候叫 LUI ( Language User Interface ),它不见得是件好事儿,我发现越来越多的创业者的话,天然的思考,“我要做一个 AI 产品,就会思考说我要做一个chatbot,我要做一个聊天机器人,然后我要用自然语言解决问题”。
但实际上在用户侧和商业侧自然语言交互业界面都会有一些非常严重的问题存在。在用户这一侧,主要问题有几个方面:
第一个就是完全这种交互的话,它其实缺乏场景感和上下文。比如,我自己来跟你聊天,我说“帮我递过来那个杯子”,如果我们都在同一个场景下面,你看到桌子上有一个杯子,你就很自然的会帮我递过来这个杯子,对吧?所以这里,我们其实是有一个场景和上下文的。
但是如果我不考虑场景和上下文,我只考虑我们的对话本身,我说“给我那个杯子”,可能你就会想说“给你哪个杯子”,对吧?“你说的是啥呀”,所以,这个时候纯粹的自然语言对话,它其实是缺乏上下文的。什么叫有上下文呢?比如说你在一个 Excel 里面,把 B2 格的那个数字拷贝到 B3 格去,那这个时候其实你是在一个上下文的 Excel 的格子,当你在旁边说话的时候,它是可以引用到这个上下文,那这个时候反倒是更合理的一个处境。所以我觉得大家要考虑的是,很多东西未必是完全要用自然语言来理解的。
第二个就是假设桌子上有一个杯子,我把这个杯子拿起来,其实我的操作对象是非常之明确的,就是我要操作的是这个杯子。那比如,我刚刚说的那个 Excel 的例子好了,其实我去点出来那个 B2 格子和点出来 B3 格子,其实这个时候我的意图的表达和对象的识别会更精确一些。反倒我用嘴巴来说 B2 格拷贝到 B3 格其实还挺麻烦的,所以在意图识别上的话,站源交互也不是最完美的一个方案。
那最后一个就是如果这件事情我要经常操作。其实手点来点去,拖来拖去可能还会更方便一点,比我每一次都要说 B2 这个挪到B3, B4 挪到B5,这样子其实更麻烦。有点像我们现在虽然大部分时候都是在用那个叫做图形化交互界面GUI,但是实际上,很多时候用键盘的快捷键还是更方便的。虽然就是更不符合直觉,对吧?那当然是我们对着一个图形界面更符合直觉,那为什么要按 O 键它就会什么存档,对吧?就按 O 键就会打开,这很不 make sense,但是其实在熟练功,假设你一个任务是要长期快速进行的,这个时候讲的其实不是要灵活性、要更加宽广的空间,而是讲执行效率的时候,其实自然语言交互界面也未必见得是最好的方式,这是在用户侧。
所以大家可以考虑一下说你的产品用自然语言是不是最好的交互方式?然后有没有可能它要结合一些其他的 UI 来实现?这方面讲的最好的其实叫做 Linus Lee,他是 Notion AI 的合伙人。大家可以去搜索 Linus Lee,或者看 AI 炼金术以前的文章,里面有很多他的演讲,在讲说自然语言交互界面的局限性,以及我们应该怎么样去设计 context。设计 intent( 就是识别),让用户有更加方便的 action( 行动)的方式,大家可以去看一下,可以打开更多的思路。
当然如果光是从用户交互界面来看,无非也就是牺牲一点效率。但是,自然语言交互界面灵活,总归好像是一个可以搞定一切事情更方便的方案,所以好像还是不一定说得通。那还有另外一个原因,我觉得不应该完全靠自然语言交互界面,是因为它对创业者在商业上其实不是很有利,因为如果都是一个 bot 可以解决问题,都通过说话解决问题,其实这个交互界面是统一的,就像你对着 Siri 说话的方式和你对着那个 ChatGPT 的那个语音版说话的方式其实是一样的,都是在聊天,就是你都是把对方拟人化,然后你跟他说你要干嘛。
那如果点评也是这样子一个交互界面,脑图也是这样, Excel 也是这样,都是一个对话框的话,理论上来讲所有的界面就是可以相互替代的,也就是说不管你是做啥的,比如说,你是做 Excel 的,你就非常容易会被 ChatGPT 或者 Copilot 或者 Siri 给吃进去。
因为你也是一个框,跟一个机器人在聊天。他也是一个框,也跟机器人在聊天,所以这个时候把你吃进去就非常容易。即使我们先不管 CUI 是不是更好,假设你的产品形态就是非常的适合 CUI 的话,那很有可能你面对的是一个赢家通吃的一个战场,你的竞争对手虽然现在好像没有什么关系,但你的竞争对手很有可能是ChatGPT,是Copilot,是Siri,甚至于你的竞争对手是Character,这就很尴尬。
如果说你认为,竞争就是竞争嘛,将来你可能是它的一个子模块。那很有可能这一部分的话,我们抢入口是抢不过的,那个时候就会变成纯粹的能力输出,比如说 ChatGPT 会调用你来生成脑图,调用你生成表格,调用你生成图片,这样子就是纯粹的能力输出了,因为 CUI 的控制能力肯定不是门槛,模型升级就会搞定它。那这个时候就只能是我们有独特的、在 AI 之外的一些门槛,比如说我可以调度线下的快递员去送餐,就是类似这样的能力。
如果你是真的考虑这样的能力,就应该更加极端化,把自己直接 API 化,不要做什么 AI 交互界面了。因为没有意义,迟早会有被“吃进去”的时候。那就应该更加极端一点,要建设我们的核心能力,而不是要去做一个界面,去优化自然语言交互让使用体验更好之类的。如果你的使用体验只是一个纯粹的对话框的话,是没有竞争力的。
所以也是我在劝一些朋友,他的界面本来是一个非自然语言的界面,他计划把自然语言界面做的越来越大~我就在劝他说,“不管这条路是错的还是对的,你只要做到越来越大,是自然语言为界面为主导,原来的界面为辅的话,那理论上来讲你就应该会被 Siri 、被 ChatGPT 之类的平台给吃掉,你其实是没有机会的”。那这就是我的第一条谬论, CUI 不见得是件好事,从用户侧和从商业侧它都未必见得是件好事。
②
UI 不止有 GUI 和 CUI
第二个跟大家分享的点是:UI 不仅只有 GUI 和CUI。不是只有图形交互界面和这种点来点去一堆按钮、一堆菜单或者你跟它说话这种方式。还有很多其他的交互方式,比如在 AI engineering 大会上面有一些展示。当你跟 ChatGPT 在对话的时候,电脑有摄像头,它可以看到你是不是在他的电脑的正面前,如果发现你在正面前的话,他就跟你打字交流,如果发现你已经走开了,他这个时候应该切换到语音。它是可以有视觉感知的,那我们除了在屏幕上点来点去以及跟他说话之外,有眼睛的他应该可以看到我们的行动,看到我们在不在,甚至除了看到我们在不在之外,他也可以理解更多的常识。比如,我们之前在 AI 炼金术公众号上讲过的一个例子,“有一个电话是你很不想接的,你就直接竖一个中指,这个时候它也大概能够 get 到你其实不想接这个电话,所以,它不一定需要我们有明确定义的一个button,或者明示一个语言,这个时候也是能够理解你的。”
或者我们再反过来说,最近经常有朋友找我聊 vision Pro 的体验之类的,那 vision Pro 里面假设说在玩游戏, vision Pro 现在是可以看到表情的,如果它里面的那个假设是个谈恋爱游戏,对方跟你聊天的时候,其实就会看到你的表情,如果它说“今天晚上要不要去看烟花?”然后你就皱皱眉头,它就应该问“你不喜欢烟花吗?”或者说,“唉,你有什么别的安排”,而不见得需要你去两个按钮来回复说“看烟花还是不看烟花”。所以它应该还有对常识的理解,有视觉的识别,甚至于它应该还可以跟我们的环境相结合,就像 AI engineer 大会上的一个案例,当你在看书的时候,书上面会有很多插图,你应该指到某个插图,然后说,“唉,这个图帮我拷下来”,它应该看见这张图,然后帮你拷下来,所以它应该可以跟我们的实际生活当中的环境相结合。
总体上来讲就是大家可以考虑把思路放的更宽广一点,所谓的 UI 不见得只有 iPhone 上的那些点来点去的交互,或者 ChatGPT 这种聊来聊去的交互,还会有很多种其他的可能性,大家感兴趣这方面的话可以去 YouTube 上看 AI engineer 大会,它上面有无数的例子都很有意思。
③
把 LLM 当计算器,而非大脑
第三个观点的话,其实仅仅是个观点,只是为了给大家打开思路,我觉得非常开我的脑洞,但是它并不见得就是对的。大家可以思考一下,你现在考虑大语言模型时,是不是已经把它拟人化了?当一个大脑在看,你把它当一个brain,当一个computer,但大家往往没有把它弱化到当做一个calculator(计算器)。那什么叫当做一个大脑?什么叫当做一个计算器?比如你看到一段文字,如果你把它当一个大脑的话,想到的都是“帮我写长一点,帮我写短一点,帮我润个色,帮我加个例子”,这是你对着一个人的方式。当你把它拟人化之后,就会有一个问题,我们会不自觉的在脑子当中把人类的限制框定到大语言模型上。刚刚我们说的什么?把它写长一点、写短一点,加个例子之类的都是人类能做到的,所以你只想得到这种应用场景。但还有很多人类想不到的,做不到的事情,我们就会默认它做不到,其实它更适合Linus Lee 曾经举过一个例子,在一个界面上面有一篇原文,他把那篇原文拖来拖去,当拖的越远的时候那篇文章就改的越大,拖的越近的时候就改的越小,其实他是把一个文章乘以了一个距离,他把它当做了一个算数(就像我前面说的计算器),他让它做了一个算术,然后得到了一个答案,或者说一篇文章。比如你写了一篇 300 字的文章,我们把这篇文章的框给拉大,以前我们把一个框给拉大的话,可能就是那些字变大,但是现在,完全可以你把框拉大的时候, 300 字就变成了 600 字,你把框缩小的时候, 300 字就变成了 50 个字,这样其实是把原来一个图形的空间大小乘以了原来的那个文字向量,然后我们得到了一个结果。其实它里面是进行了一个计算,这种交互界面就不是拟人化的说“你帮我多写一点,少写一点,大一点、小一点”,而是更加的直观的在对我们的操作物体和操作元素,比如距离、空间大小进行运算。那我们在交互界面上可以考虑的设计点就更多了,脑子也会更开放一点,主要是我现在看到太多的产品,几乎都是一目了然就发现,“唉,这个东西太显然了”。所以这一个观点就给大家开开脑洞。
那再往下也是Linus Lee 给的一个例子,我受他启发还蛮多的,他这个例子是讲的他自己的照片,加乘以一些词汇,比如乘以悲伤,照片乘以悲伤,那就更难过了。然后照片成了一个悲伤的人,那就更难过了,成一张悲伤的小老鼠的照片,也更难过了。
所以你会发现,图片跟文字,甚至于声音,如果我们把它们全部向量化的话。它们其实就是同一个种东西,所有的这些东西理论上相互之间应该都是可以做运算的,所有的数字实体都是可操作的对象。我们自己对于跟这些数字实体的交互,比如我刚刚说的把文字的框变大一点、变小一点,或者把它距离拉远一点,拉近一点,远近大小这些我们的交互,这种 input 和所有的数字对象本身,它们其实都是可操作的对象。基于这个设计理念,你就可以做出很多新的交互界面了,它既不只是聊天,又不是原来那种点点按按的样子。希望有助于大家打开思路想一想。
④
谈恋爱和身心灵才是正经事
第四点,我想说的是谈恋爱和身心灵才是正经事儿,就是干活不是正经事儿。大家如果前一段时间关注过“完蛋我被美女包围了”,就知道它的热度很高。因为大部分人其实还是很渴望陪伴和被看见、被关注的。所以大家可以更多关注一下娱乐情感和陪伴这个赛道,不要老是盯着生产力,娱乐陪伴和情感的话也不一定就是要搞瑟瑟。
我讲一个离黄色最远的东西,甚至于在宗教领域也已经有很多尝试,比如说你拜佛,佛也不理你,上帝也不回应你,那现在其实都是可以有回应的,这里面其实有很多机会。如果你感兴趣这个领域的话,欢迎联系我,我们正在孵化这一类的项目。
如果你是虔诚的,不管是哪个宗教的教徒都非常欢迎你联系我们。接着上面的话题来说,恋爱和身心灵不光是有性,它还有各种各样的自我成长、宗教性的觉醒,这些其实都是关系。有什么关系比跟神的关系要更神圣、更有约束力?所以我觉得大家可以多看看情感领域,多从非效率的角度去理解问题。
⑤
讲生产力,人类才应该是 CoPilot
当我们讲效率、生产力的时候,其实本质上效率和生产力是用来形容工具的。如果你是形容一个工具的话,说实在的,我觉得人类自己应该是 Copilot,我们现在是管机器、管 AI 叫Copilot,说它们是副驾驶。但是你仔细想想如果是在讲效率、讲生产力的话,其实我们是在以一个评价工具的指标在衡量它,那人类是一个好的工具吗?人类其实不是一个好的工具,我们还要吃喝拉撒,我们还有各种小心思。
人类不是好的工具,就好像福特说的,“我其实只是想雇佣一双手,但是不得不也雇佣一个脑子”。所以人类其实就不是好工具,或者人类不应在生产力发展到一定程度之后被当做工具。人类应该做Copilot,让机器去做 Pilot。
那之所以把 AI 叫做Copilot,其实是历史原因和政治原因造就的,这个应该是 GitHub 最先称它为Copilot 的,他们之前在微软的时候拿到的是 GPT 3,经常出错。他们当时思考的是如何定位这个 GitHub Copilot,让它在经常出错的情况下仍然被认为是一个有价值的存在,所以就把它定位成了Copilot。
副驾驶说我就是个提意见的,我是个幕僚,我给主公献上“上中下三策”,最后的决定权和责任是主公的,这样子就比较合理一点。但是现在我们用到的 AI 的能力,哪怕是国产的,其实也已经超过了当年的 GPT 3 了,至少大部分已经达到 GPT 3.5 左右的水平。所以当年称其为 Copilot 其实是因为它能力不够,而现在能力已经比当年好很多了。
另一个原因是,因为讲 Copilot 其实是为了政治正确,为了表达说“呦~人类还是被需要的,未来不能用 AI 替代人”,这样讲大家情感上接受起来会舒服一点。如果直接讲“凡是工具性的事情,应该 AI 就能替代人”,那讲这句话就很容易引起情绪上的不适,就会很想留言来骂我下。所以我们大多数时候不会那么说,我觉得这个是不对的。
如果你真的要讲生产力的话,其实就是把人类工具化,人类应该是目的,不是工具。当我们把自己当做目的时候,我就是本自具足的,我本身就有价值。吃吃喝喝、睡懒觉我们就觉得很舒服。但是如果把自己当工具,就会觉得“我总应该做点什么,我总应该做出点什么?我总应该证明点什么”,才能够证明我有价值,所以就会天天不开心。
但是我们跟真正的工具相比,又很难真的按照工具理性上的最优策略去行动。就比如大家投资都知道那些大道理,但是都投不好,对吧?都知道要早睡早起,却做不到;都知道每周要运动 3 次,也做不到;还知道刷刷抖音,刷一会就要停掉,或者不要刷,还是做不到,对吧?我们都知道很多道理,像工具那样理性上的道理,其实我们脑子里条条框框挺多,但是反正我们做不到,投资策略什么的,比如不要贪婪,或者别人贪婪的时候我恐惧,类似这些道理每个人都讲得出来,就是做不到,但工具做得到。所以理论上来讲,我们应该把这些工具的策略给工具,让工具发挥更好的价值。
作为人类,就是当工具有什么地方需要帮忙的时候,人类过去帮帮忙。在生产力的领域,其实人类应该是Copilot,应该让 AI 做 Pilot。那你可能会说那 AI 现在不靠谱呀。比如说 AI 开车开不好什么的。我有些不一样的看法,第一个就是 AI 会不断进步,它的进步速度远远的大于人类的智商的进步。第二点,就算它没有进步,但我们现在衡量它们的标准是有问题的。比如我们觉得人类开车比机器开得更好,说不放心机器开,其实我就觉得机器开车肯定开的比我好,我都不太敢上路。之所以说人类开车更好,只是因为车子是为人类设计的,你那辆车大部分是为我们设计的,这个任务设计本身,就是为人类的优缺点定制的。所以让 AI 硬塞进来就会觉得有多种不合适的地方。下一代的 AI 产品,我们可以再开放思路一下,想一想有没有可能我们为 AI 原生设计,比如说做PPT,如果你已经有了一整套的思考,然后你让 AI 帮你完善,帮你做,你会发现它想的总归没有你想的好,因为 PPT 这种做事的方法就是人类的工作流,你把 AI 套进来就不合适。
但是如果告诉 AI 说你设计 PPT 的目的是什么?让它去生成 20 条故事线,来证明“明年我们应该打下沉市场”。让它去设计 20 个故事线,再在网上根据这 20 个故事线去找材料支撑,找那些漂亮的数字图,麦肯锡的报告,它可能发现中间有 15 条故事线找不到资料走不通。还有 5 条故事线走得通,又把这 5 条走得通的故事线,帮你塞了一堆资料,最后将这些给你看,让你挑一个。这就不是说你已经想出来一个故事线,让它做一个类似的,或者做一个比你更好的,而是它会去探索更多,用它速度快、搜索广的优势来覆盖它。可能在第一步思考时没有你想的好这个优势上,就把做 PPT 这个任务的工作流改掉了,改造成更加适合 AI 来做,很有可能你会发现其实应该以 AI 为主,以我们为辅。
或者说我们现在设计一个工作岗位的话,很少设计一个岗位:要懂中国古典诗词,又要懂西班牙语,又要懂法语,又要懂微积分,又要懂量子力学,对吧?我们不会设计一个东西,它需要你 100 个领域的 60 分的知识。我们大部分是专业岗,但是 AI 其实非常适合做横跨 100 个领域的这种事情。只是我们现在还没有这方面的工作而已。未来 AI 哪怕不进步,那我们为了适合它的特点应该重新定义工作,重新定义任务。
这边举一个例子,在 AI 炼金术的公众号上也说过,就是如果这个世界是猫统治的,它一定会去把任务,比如说抓老鼠这个任务,它一定会去评测说它做出来这个“猫工智能”会不会爬树、能不能钻洞这些技能好不好?但实际上它做出来的“猫工智能”很有可能是一种“智能”,就是跟它的那个智能的方向发展方向是不一致的。
那这样一种“智能”很有可能像狗,那像狗的话就应该出去闻味道,去识别老鼠会经过哪些地方,然后提前埋伏。那你就不要去测评它会不会爬树和会不会钻洞,你应该去设想的是它如何更好地去抓住老鼠,应该采用叫做“通过嗅觉识别老鼠路径”,然后提前埋伏的方法,那整个的工作定义就应该改掉,把它给用好,而自己做辅助,比如说去堵住洞口。所以大家想一想,就是我们很有可能还是自己被自己的思维给局限了,我们可以思考的点会更多一点。
前几天在跟朋友在沟通的时候在聊说,我们用人类的方式去沟通的时候,还是太多的地方用了人类社会的隐喻,就会给我们形成条条框框,比如在人类社会里面,你会觉得一家公司的 CEO 是比较难当的,那然后一家公司的实习生这个岗位的 offer 是比较好拿的。
所以我们就总想说,那可能 AI 也要一级一级去搞。但实际上你想想,实习生往往要做具体的事情,他要完成具体的任务,现实中可能完成不了的。但 CEO 往往是吸收大量信息,然后来做决策或者提醒,或者在点评下属发过来的东西说:“来,你给我三个方案让我挑一下”,然后再质疑说你有没有考虑这个点?那个点。
你会发现说其实在管理大量信息的收集和权衡,就是信息的广谱的吸收,然后再做理性的决策,甚至于在教练式沟通管理方面, AI 会做得更好,它不需要干实事,反倒干得更好。所以很有可能 AI 会先做 CEO,最后才能做成一个合格的实习生。
讲这么多其实就是为了给大家讲一堆有的没的话,大家可以开放一下思路去想 AI 产品的原生产品的设计,不要框住了,就把它想象成一个人,然后又把人类社会这一套奇奇怪怪的又套进来了。
⑥
拆解流程才能用上 AI;重构流程才能用好 AI
第六条要讲的是,拆解流程,我们才能用上AI,但是重构流程才能用好AI。我现在是几家上市公司 AI 方面的顾问,会跟大家讲“你们要拆流程,然后把它拆成一个一个的 task,把一个工作拆成很多的任务,然后任务里面我们再看哪些可以用AI,不能用 AI 的,我们用双战模型,先发散再收敛等等”,这个往往是大家最好接受的,因为它其实没有改你的工作流。
大家一看说,“噢, AI 可以做这个, AI 可以做那个,哇,降本增效棒棒的”。但实际上你会发现这样的叫做 AI 转型的方法的话,在实际过程当中还是会遇到很多问题。因为第一个大家其实拆不下去,就是拆流程,很多时候之所以这是一个岗位,就是因为拆不清楚,然后模模糊糊的就这么干吧了。另外一点是专业人士对于 AI 做出来的东西都是不满意的,比如,一个编辑,你让 AI 帮他写东西,要按照他的风格写,反正写出来的编辑本人永远能够挑出毛病来。
但是你反过来想,如果我们不是去讨好这个编辑,因为讨好他的话就是去套原有的流程,你就会发现 AI 是一个叫做“被考试的角色”,就是你会把原来那套流程或产出当做 100 分,或者哪怕不是 100 分,原来那些做的也不好,但是你会去问原来那个编辑说“ AI 做的好不好”,他给的评分肯定不高,他会挑出它各种各样的毛病。那就建议是反过来,让它去做新的题目,改过来。比如那个编辑写出来的东西是 90 分,那 AI 做出来的这里扣 5 分,那里扣 5 分,它只有 70 分,还是不能用它来取代我。那我们就说“好不能用它来取代你,那我们来重新设计这个任务,我们不完成原来那个任务了”。
看看编辑原来那个任务的目的是为了啥?比如为了吸引流量,比如每周发出一篇好文章,让我们的粉丝量变多,那我们就把给AI 的任务变成为“吸引更多流量”,那有没有可能我们用 1, 000 篇 70 分的文章做到比原来编辑一篇 90 分的文章更好的来吸引流量呢?比如说你原来一篇好文章只能发一个媒体,那现在是不是可以去知乎上找到 1, 000 个跟我们略微有点关系的问答,去答题,回答的问题过程当中把自己的产品也带进去。这样的话对于文章的要求就不高了,因为这就不是一篇文章要花 3, 000 块钱媒体费去推广,而是就到知乎上去发言,那 AI 一周可以搞 1, 000 篇,你一周只能搞一篇,那 AI 能不能以量取胜?我们可以重新退回到我们工作的目的,然后从目的再重新设计我们的工作流和任务,而不见得是要把 AI 嵌到原有的工作流里面。嵌到原来的工作流里面,会在沟通的时候会比较受欢迎,但是之后会遇到其他的问题。
这是第六条反共识。
⑦
AI 是高效小偷
我们接着讲第七条反共识,这个就更加政治不正确了。目前来看的话, AI 其实是一个非常高效的小偷,因为传统的知识都是固态的,比如说一本书,他写了一个一个字的一首诗,一幅画。那现在 AI 做到的事情,是把所有原有固态的这些知识产权把它变成了水,原本的如果都是冰块,AI 把它变成了水,变成了液态。同时 AI 又有一个方法,可以让它在不同的模具里面重新凝结成固态,那这样的话偷东西就很难被看出来。比如说有一个网站 Cuber ,你看到这个网站里面有个人是讲播客的,每一期播客讲两三个小时可长了,然后就有另一个网站,把他的那个播客都放进去了。并且告诉大家说“我们这是用那个人的播客语料训练出来的 AI,大家可以跟它去沟通,去问它问题,比如我昨天晚上没睡好是什么原因,它就会从神经学角度跟你讲,引用博主自己播客里面的论点来回答你”。
这个网站好像是他自己做的,所以没有什么问题,他好像叫 Huberman lab,但你想是不是其实我也不需要经过他同意就可以这么做,因为他的播客都放出来了,我可以帮他做一个。如果我帮他做一个的话,本质上其实是在偷他的知识,但是我会偷的好像跟原来不一样,原来我会把他的一段话拷过来,但我现在没拷,我只是用它来训练了我的模型,让模型根据他的回答来说话,甚至于可以训练的时候说“请模仿海绵宝宝的说话风格来沟通”,这样子别人就更看不出来了。
所以我们会发现,其实这一次 AI 的革命会带来一个非常大的变化,它会让知识产权液化,液化完了之后存在着一波很大的冲击,如果原来你是掌握知识产权的人,很有可能你的东西是没法被保护的,以及如果你是土匪的话,现在你是很有可能拿这个来抢东西。
我再举几个例子,几个非 AI 领域的例子,比如说搜索引擎,大家现在觉得百度能够搜到东西, Google 能够搜到东西,合情合理。但是他们刚刚出来的时候,天天被打官司,天天被告说凭什么你可以收录我的内容,后来有一个协议,让这件事情合理化。
大家现在想想搜索引擎合不合理,还有一个例子就是樊登读书合不合理,因为樊登就是把书里面的段子和一些好玩的内容讲出来,用他的语言讲出来。但是那个知识其实是经过他的大脑吸收了,然后再讲出来的,这个算侵权吗?那如果 AI 把所有的东西也读懂了,然后讲出来,甚至于根据你的当下的情况跟你有针对性的讲出来,这个算侵权吗啊?如果不算侵权的话,那怎么办?如果算你侵权怎么办?还有短视频,现在经常,曾经常,大家会看到“这个男人叫小帅,这个女人叫小美”,短视频把很多电影给模块化剪成 5 分钟,这个合不合理?再比如说你看了一个小红书上你的竞品,它的小红书的文章爆款风格特别好,你就跟 AI 说,“来学一下这篇风格,然后把帮我写一篇”。
它是根据竞品小红书的爆款文案风格帮你写的,模仿了对方的风格,这个时候算不算偷东西?这里我也不知道答案,就是让大家想一想,有没有可能这一次是一个新的偷窃技术,如果它真是一个新的偷窃技术的话,你有的资产有没有可能被保护?还是你要拥抱?如果你拥抱它的话,你是做土匪、做强盗这一方的话,如何去抢东西是既有效的,晚上又是睡得着觉的,那要怎么找到这个平衡点?它到底在哪里?
⑧
AI 是相机不是引擎
第八条过得快一点,因为这一条挺晦涩的,叫做 AI 是照相机,不是引擎。
这有一篇文章,我看了觉得真的是让我整个人都震掉了,但是我给徐同学看,徐同学说“我真的没有理解你为什么那么喜欢这篇文章”。那篇文章的观点就叫做 AI 是照相机不是引擎,因为如果它是引擎的话,它就更像是 CAD,你可以用它画画,用它做3D 设计,它是无中生有。但如果它是一个照相机,它是一个望远镜的话,它其实不是无中生有,它是帮助我们把一件事给看更清楚。比如望远镜,你用它去盯着月亮看,但你没法改变月亮,你最多也就把颜色看得清楚一点,模糊一点,分辨率高一点、低一点,但是月亮还是月亮,你不能改变月亮。
所以偶尔会有一些人的观点是我们现在都把 AI 当引擎在做。我们甚至于认为它是一种智慧,那它究竟是不是一种智慧?还是一个只是帮助我们看清世界的一个方式,那这里面关键的底层哲学上的看法,,叫做说“智慧是数据的特性,还是一种独立的能力?”
什么叫智慧是数据的特性呢,就是攒到足够多的数据之后,它就会产生一种东西叫做智慧。还是说智慧是一种单独发展的很独特的能力,它是用来处理数据的。如果智慧是数据的特性的话,那可能我们就并不是要培养一个 AGI 去解决各种问题,而是我们需要积累不同领域的数据,然后它会自己产生一种特别的智能,然后我们做出一个翻译来搭个桥,让我们理解它智慧的意思。比如,我们会把太阳的各种数据灌给它,灌到足够多的太阳的数据之后的话,它会自己产生智能。这个时候我们的 AI 和太阳的AI,它们就可以聊天,我们就问我们的 AI 说,“你帮我问一下,下一次太阳黑子爆炸是什么时候啊?”然后太阳 AI 就说"我会在什么时候爆炸",中间我们的 AI 帮我们翻译一下。假设这个判断是正确的,就是智能是数据的属性,而不是一种独立的能力的话,那我们有可能会通过喂养不同的数据产生不同的一种智能,并且让它们开始沟通,而人类成为智能中间的一种。那我们所做的 AI 其实最重要的是我们的一个翻译器的功能,万物有灵,让我们可以去跟万物之灵去沟通。当然这讲的有点玄幻了。
⑨
AI 产品经理的第一性原理
第九条是我觉得 AI 产品经理的第一性原理就是忘掉现在的解决方案,因为我们都会默认现在的解决方案是合理的。但实际上都是某个人某年拍脑袋拍出来的,这句话往再书面化一点讲,叫做“当下状态是一种构建,而不是一种天经地义”。这也在 AI 炼金术的公众号上提过。
我们会很自然的觉得修改网页应该是独立的修改,然后再到一个浏览器里面去看它到底修改的对不对。你修改一个网页是这样的,但我们默认你在 word 里面打出来那个字,应该最后就在那里,所见即所得。我们是先发明的所见即所得,后搞的网页这些东西,为什么网页没有做成所见即所得的呢?这其实就是一个很奇怪的路径选择。
所以很有可能我们会要求对于新的产品的设计,为了摆脱现在的一些习惯或观念的束缚,会有不同的方法,一种方法就是理念先行,比如说你就觉得这个世界应该所见即所得,然后你用这个理念去重新设计一切的产品,因为有一个理念把我们往前带,这样可以让我们忽略掉当下的很多的惯性,我们看不见的隐含假设的束缚,这个会有价值。
还有一种方法,就是我会觉得现在越来越理解到要去看几十年前的人的想法,因为他们没有经过移动互联网,他们的想法是基于当时的一些隐含假设的。所以他们有的时候对于未来的那种很科幻的想法,反倒是没有被污染的一些非常天真的或者非常没有边界的想法,那些想法反倒可以帮助我们看见问题的本质,而不是在现在的一些产品上加个 button 或者加个 AI 的框,在旁边 Copilot 一下,我们想象力太有限了。
所以可以多去看看老文章,之前我一直是在订阅邵楠他们的产品沉思录,他们经常发一些很古老的文章。我之前其实就随便看看,最近就在非常认真的看这方面的东西,会觉得这个东西真的是有用的,就是因为它过时了,所以它有用。
当下的东西真的就是我们都在同一个 bubble 里面,同一个隐含假设的约束里面,我们自己看不见同时代的人,那么我们看上一个时代的人,他们的隐含假设,他们的 bubble 不太一样,这个时候往往就能够帮我们显著的打开视野。所以我最近在认认真真的看他们上面的一些老文章。
插播广告 ^_^
在这里插播一个广告,我在做一个面向海外市场的 AI 化器,所以如果你是 AI 方面想要创业的话可以通过我的公众号或者邮箱联系我们。我们可以为每个项目提供几十到百万美金的一个启动资金。如果要更多也是可以的。我也可以按照 VC 投资的逻辑来投,也不一定是孵化。但如果是孵化,除了资金之外,我们还可以提供海外的一些营销能力,甚至提供产品能力,或者帮你把 AI 产品化。
希望你的项目不是一个idea,因为 idea 真的不缺,我们现在比较缺的两个东西,一个是海外市场的真实的洞察。得告诉我说做了真的卖得掉,或者上线后多少个月可以打平,多少个月可以做大。所以海外市场的洞察和真正的营销获客能力,在我这边看起来是比产品能力更重要的。因为产品我可以帮你做,只要你确认,上线就能卖掉1万份,每一个卖 100 美金也开开心心的,所以的话希望是有海外的市场洞察,而且这个洞察要有证据,最好你有把这个洞察给抓住,变成钱,变成用户的能力,那我们这边研发也可以配,钱也可以配,海外营销也可以配。最关键就是这东西能卖掉,这是关键。然后一定要有证据,没有证据的话都当是瞎说。
⑩
产品的用户是用户的老板
广告插播完毕,我们接着讲第十条,叫做我们定义的产品的用户,很有可能不是用户,而是用户的老板。什么意思呢?比如你做个画图的应用,那我们就会说那个图应该画的怎么怎么好,但是很有可能你会发现你做的画图应用是在不断的替换掉,现在在使用你这个产品的人的。
最终使用这个产品的人会是当下的这些用户的老板,因为原本他就在指挥自己的设计师说,“你要把这个背景改亮一点、改暗一点”,然后设计师就在吭哧吭哧改。所以一开始可能是设计师在用你的画图 AI,但是用着用着老板就会发现,好像设计师也是在跟 AI 说,要把这个背景改亮一点、改暗一点,那老板可以直接说啊。
所以很有可能最终的使用场景并不是当下的第一批 early adopter,就是这些专业人士在用,而是雇佣这些专业人士的他们的老板或者客户。我们的产品所服务的对应的 jobs to be down 可能会越来越抽象,如果原本PS对应的是像素,它操作的是像素。Figma对应的是设计稿。那如果出 AI 的话,它可能对应的是意图,那再往上,如果是在一家公司里面,很有可能你的用户就从原来那个干活的人变成了指挥干活的人的老板。或者说你如果是在一个链条上面的话,就变成了原有那个人的甲方,所以,如果它本来是个降本增效的应用的话,很有可能砍的是第一刀就是用户本身,然后你成为它的上游。
那如果它是一个降本增效的项目的话,我在一些公司发现它就会变成 AI 革自己的命很难,但它挥刀砍上下游会比较简单。比如让设计部门去思考 AI 怎么样辅助设计,他们就可以挑出 100 个毛病。但是问营销部门,要不要有些设计稿,有些海报自己出,大家都会觉得,AI 好像还挺好用的。
所以这个抽象层次往上走的话,那么原来的具体的功能岗可能会受到的第一波冲击,那我们在设计我们的用户究竟是谁的时候,可以往上想一想。
⑪
穷惯了,要学习过富裕的日子
第 11 条,那这倒数第 2 条叫做穷惯了,要学习过富裕的日子。什么叫做穷惯了呢?就有点像是大家经常听过的故事,家里住个大别墅,结果什么妈妈爸爸来了之后还出去捡废纸、塑料瓶子堆满家里,再去卖掉。在父辈的那个时代东西很稀缺,他就总想多攒点钱什么的。即使到了东西不稀缺的时候,有钱的时候,思想也很难转过来。
假设过去我们的智慧是稀缺的,我们在做一切设计的时候就都会有一个默认假设,就是尽量节约。就有点像我们小时候接受过的教育叫节约用水、节约用电,那我们其实有一个默认的叫做智慧是很贵的,我们要节约用智慧。
举个例子,就批改作文这件事情,我们要用 AI 如何批改作文,可能第一步你就会想让 AI 提出来意见,让它取代老师的批改的话,他可以做得更仔细,一定要把作文中优秀的地方勾选出来,然后给孩子好的建议,balabala~很容易往这个方向想,但你仔细想一想,批改作文这件事情本身就有问题,这是在智能稀缺的时代的不得不的产物。我们仔细想想,老师为什么要批改作文?为什么老师不给学生打样?是因为在已有的内容上面圈一圈,然后提两句意见,说好或不好。这样的点评是比创造在智力上消耗更小的操作。你想,让老师帮不同的孩子,根据他们的个性写 50 篇文章比较容易,还是他去给 50篇作文打分、写几句评语比较容易?那一定是点评比创作容易!
我们如果在之前的这种智力稀缺的时候,我们思考的点,就是把它编成点评、批和改。那我们在做 AI 的时候如果仍然想的是优化批改就会掉到老路的坑里面,是用新科技走老路,没有用。那如果创造很简单的话,那孩子写完作文之后应该是告诉他说:“你写的这哪几段话,我觉得写得挺好的。其中这一段还有几种不同的表达方法。我可以用朱自清的方法、用老舍的方法,李白的方法写一遍,分别让你参考,孩子你更喜欢哪一种啊?哦~我发现你更喜欢这个风格,下次我就按照这个风格告诉你如何调整,那你觉得你跟这个风格的差异主要是哪里?你看其实你只要改这两个字,是不是就更像李白的风格了呀?那我再演示几个给你看,比如你很喜欢奥特曼,那我们就讲一个奥特曼的故事,用李白这种风格在写一个奥特曼的故事。”这相当于我们在里面投入了一个巨大的智能资源帮孩子写作,根据他的偏好去引导,这原本是做不到的,但因为现在智能很便宜,所以我们就应该朝着这个浪费的方法去做,而不是原本受限于智能很贵的时候定义的“对作文的一个反馈叫做批改”,我们现在用批改这种方式,这是一种智力上的偷懒,就是用新科技走老路,所以大家可以打开思路,想想看有没有可能我们基于浪费来设计,而不要基于稀缺来设计?
⑫
非用户,才是新用户、好用户
最后一个,叫做非用户才是新用户,才是好用户。
很多时候我们设想的 AI 的产品打的其实是原来已经在用某种产品的人,再跟用户说我的东西比它更好。比如说你用的脑图不好用,我的脑图更好用,你的 Excel 不好用,我的有 AI,旁边还可以教你写公式,我的更好用,很多是这种类型的产品,其实不太好。
我觉得主要是两点不太好,一个就是打不过,如果再打一个老市场的话,那么老市场已经有用户了,已经有成熟的产品,比如已经有office,已经有 PS 了。这个时候他们也会加 AI,他们也不傻,最多也就是因为合规什么的事情会慢一点,但是迟早会加的,所以你做好之后大概率别人还是会在老的产品上。我见到现在有很多人在做 office AI,做一整套新的 AI word ,我会觉得人家 Word \ Office本身就会出 Copilot,现在重新做的话当然不如它上面直接加一个 AI ,最后会殊途同归,都是一个大的工具,加上 AI,你是从 AI 走过去,他是从工具走过来,他那边已经有了极强的用户习惯和极大的用户 base。这样走过去是打不过的,所以,我认为面向老用户的老应用场景是真的是没有用的,但是我觉得新用户才是好的。
就比如说像 Midjourney,我跟徐文浩写的 AI 炼金术的logo,当时就是在一个群里面,大家用 Midjourney 在画 logo,花 10 分钟画了好多个,然后决定我们就这个吧,大家可以看到,那就是大概是一两年前的 Midjourney 的水平。
你可以看到虽然那个字写的乱七八糟的,但就用了呗。对于我来讲,之前是不会想到自己去画个 logo 的,所以在之前的美术设计市场,我是个非用户,那有 AI 的这个时候,把我抓进去不就更好了嘛,把我抓进去我不会去挑剔说 “你看这个字,这个构图比例不对之类的”,因为对我来讲能出张图就很好啦。所以这才是一个更广的用户。
或者再举一个例子,比如 ChatGPT,很多东西它也做的不太好,像数学,它只能做简单的线性回归分析,你要稍微深度一点的建模,它就建的乱七八糟的。但中国或者整个全球来讲,大部分的营销的人其实数学都没那么好的,能见个线性回归、归因分析的人,我估计 100 个里面最多找出来半个。
昨天有人给我发美图秀秀的报告,他们去年赚了很多钱。美图秀秀就很好的一个例子。你想它会比 PS 更好吗?它是 for 设计的人更好的用 PS 吗?显然不是,但它可以让每个人都可以把自己的皮肤弄好一点,照片好看一点,眼睛放大一点,这就是一个更广阔的市场,所以大家可以考虑用 AI 做出来的产品,不要去瞄向已有的老市场,要瞄向一个拥有更广泛的需求,但是被已有的产品的门槛挡在外面的那个新市场,这批用户会更好伺候一点。就有点像做法律的 AI,比如 Harvey 这种 to 大律所的,那就是巨头的打法。但你也可以做像 do not pay 这种产品,帮你去做特别小的案子,几十美金、几百美金的案子,用户原本不可能请一个律师去帮他处理一个几百美金的案子,请律师的费用都不止几百美金,但如果 AI 来做这个市场的话,他就没有原有的人类竞争对手。
比如高速上被开了一张罚单,可以让 AI 律师帮你去想办法把这个罚单给取消掉,这其实就是一个很广阔的市场,或者像教育、像原本没有的市场,原本被工具挡在外面的这个市场才是更大的一个市场。大家仔细想想拼多多怎么做起来的?早期其实也是这么做起来的,他们早期抢的并不是天天用京东和淘宝的用户,他早期抢的很多的用户手机上根本没有京东,淘宝。他们的手机上只有微信,他们也不理解购物车概念,也不理解分类导航概念,是这样一批新人才把拼多多的第一步的基本盘给撑起来了,因为微信把整个的移动互联网门槛给拉下去了,存在了一批新的网民,拼多多把这批新网民给抓住了,所以我们现在也要看看,科技是不是可以把一批被我们忽略的人拉进了整个数字时代。我们可以为这批人做点什么。还有一个我举了千百次的例子,就是 be my eyes,它是给盲人用的,盲人平时出去穿衣服,不知道哪条裙子的颜色更衬自己,也不知道这瓶酱油到底跟那瓶酱油有什么区别,甚至于牛奶有没有过期?那现在只要拿着手机对着物品,问它相关问题,它就会都告诉我,像提供给盲人的这种服务,我们之前想都没想过,甚至我早两天听 vision Pro 的一个 Podcast ,在说很多的残障人士,比如说他不能离开家或者生病了,这个时候你让他带上Vision Pro,让他感受到在爬山什么的,这个感受就可以让人直接流泪。
我之前从来没有这样想过,我就觉得我去看个风景很平常。其实很多的用户是在我们的思考范围外的,如果我们可以帮助到这些真正需要帮助的人,不是去服务那些用 Office用得挺好的人,还想办法通过打折补贴把他们抢过来。应该去帮助真正有需要,但是被成本也好,被使用门槛也好,挡在外面的人,让他们能够看见这个世界。这种事情第一在商业价值上更高,第二如果真的做出来be my eyes 这种东西,就更值得了。当你有孙子有孙女的时候,可以给他们讲故事,爷爷当年做的这个产品就很值得炫耀就是为人类做了贡献的,不光只是赚钱。所以我会觉得大家也可以想一想非用户,而不是去抢老市场。这里面可能有更大的机会。
以上是我们在做产品的时候的一些反共识,如果你想了解详细一点的话,大部分在「 AI 炼金术」公众号上有相关的文章写过,也可以去翻一翻,欢迎大家留言讨论。也欢迎大家给 「AI 炼金术」的公众号和我们的播客评论点赞和好评,推荐给更多的人,发到各种各样的群里。虽然我们不靠这个挣钱,但是看到数字上涨还是很满足我们的虚荣心的。最后,如果你是想要创业的话,又有海外的市场洞察和搞得定海外用户,尤其是你对于海外的 influencer 的 marketing 这方面比较有研究的话,欢迎来找我来聊,可以发邮件给我,上面注明 AI 炼金术就好。如果你是这方面的产品经理,你想找个工作或者看创业机会,或者你是 AI 方面的研发的话,也可以发邮件给我。跟徐文浩一起,除了孵化项目以外也在招人,我们两个是在各自在做不同的事情,他做的比较高科技一点,我做的比较偏商业一点。