Key Points
● Meta开放AI Studio,让普通用户也可以根据个性化数据创建自己的智能体;
● Meta发布SAM 2模型,可以实时分割图像和视频;
● 下一代计算平台的产品形态,扎克伯格更看好轻量化的智能眼镜。
1974年创立的SIGGRAPH是计算机图形学的顶级会议,每年都会有众多科技公司和学术机构参加。通过图像渲染赚得第一桶金的英伟达与SIGGRAPH渊源很深,在7月30日美国丹佛的会议现场,英伟达创始人兼CEO黄仁勋参与了两场会谈。
其中一场,他邀请了Meta创始人兼CEO扎克伯格。可能是因为Meta是购买英伟达芯片最多的公司(去年已经买了15万块,今年还打算再买20万块),在这场对话里,黄仁勋不再是被访问者,而是鲜见地成了引导对话的人。
扎克伯格借机公布了Meta的一系列动态:发布让每位创作者都能拥有自定义智能体的AI Studio;发布视觉分割模型SAM 2;看好智能眼镜的产品形态,加强与眼镜制造商的合作等。
以下是「新皮层」根据会谈实录的总结:
Meta:将社交媒体整合成一个通用AI
过去,Meta旗下社交平台的每种内容类型都有专门的模型,然而在Meta创始人兼CEO扎克伯格看来,更通用的模型能提供更好的性能,它们可以从更大的内容池中学习,避免了从不同内容池中获取内容的低效率。「我梦想有一天,整个Facebook或Instagram都像一个单一的AI模型,将不同的内容和系统统一在一起,它们在不同的时间内有不同的目标,有些只是向你展示今天想要看到的有趣内容,有些则帮助你长期建立你的社交关系网」。
扎克伯格认为,「Meta AI的理念是拥有一个可以帮助你完成不同任务的AI助手,它将会非常具有创造性导向,非常通用,我认为它最终将能够回答任何问题。」他还预测,当Meta从Llama 3类型的模型转向Llama 4及更高版本时,它不会再像聊天机器人那样,一问一答地来回交互,而是会很快进化成「你给它一个意图,它实际上可以在不同的时间范围内完成任务,先确认你给出的意图。其中一些任务需要几周或几个月时间的计算工作,然后结果才会返回到你这里,就像世界上发生了什么事一样。」
推出AI Studio,让每个人都有智能体
扎克伯格在会场宣布,Meta将面向所有创作者开放AI Studio,它允许每位创作者根据个人数据,创造一个AI版本的分身,替代本人在社交平台里和粉丝互动,解决时间不够用的问题。「很多人并不只是想要与同一种智能体交互,无论是Meta AI、ChatGPT还是其他智能体,用户想要创造自己的东西,这就是我们AI Studio的目标之一。」
AI Studio是Meta构建聊天机器人的平台,此前并不是其布局重点。去年10月,AI Stuidio仅面向企业和开发者,用于服务有电商和客服需求的公司。同一时期,Meta寄希望于推出的28个性格各异的聊天机器人,还曾试图花费数百万美元与运动明星、网络红人商谈,以在其个性化AI中使用他们的声音和肖像,希望借此吸引年轻用户。经历近一年的尝试,聊天机器人系列并未在用户中获得良好反馈,现在Meta淘汰了它们。
开源理念来自微软
黄仁勋赞同了扎克伯格的愿景,他认为「Llama 2可能是去年AI领域最重要的事件」,因为开源模型激活了行业,他询问扎克伯格「Meta的开源理念来自何处」。
扎克伯格回答称,Meta做了很多开源工作,但由于构建分布式计算基础设施和数据中心时,起步比其他科技公司晚,无法带来竞争优势,于是Meta决定开源,从生态系统中受益。「(Meta)最大的项目可能是开放计算(Open Compute),我们公开了服务器设计、网络设计、数据中心设计,通过让它成为某种行业标准,所有的供应链基本上都围绕它组织起来,这可以为每个人节省资金。通过开源,我们基本上已经节省了数十亿美元。」
扎克伯格还表达了对封闭系统的不满,他提到了苹果公司,「移动端的封闭生态系统,苹果制定了标准。虽然安卓手机更多,但苹果基本占据了整个市场和所有的利润。安卓基本上是追随苹果的步伐,苹果很显然赢得了这一代的竞争。」
相比之下,扎克伯格认为微软的Windows是一个开放得多的生态系统,「基本上在这一代PC的竞争中,开放的生态系统赢了」,扎克伯格说,「我有点希望在下一代计算技术中,我们会回到一个开放生态系统获胜并占据主导地位的状态。总会有一个封闭的,一个开放的,两者都有理由存在,都有好处。我不是狂热分子,我们也做闭源的东西,但对整个行业正在构建的计算平台来说,如果软件是开放的,会有很大价值。」
黄仁勋回应,英伟达已经开发了多种专门的AI系统,比如芯片设计AI、软件编程AI,这些都是基于Llama模型微调的,他将AI系统类比成身上穿的皮夹克,「我不想自己做夹克,更愿意别人为我量身定做。」黄仁勋说,英伟达的工程师们现在使用的就是Meta于上周发布的最大开源模型Llama3.1 405B。
发布视觉分割模型SAM 2
在会议现场,扎克伯格展现了一组自家牧场的奶牛视频,在没有任何标注的情况下,正在活动的奶牛踪迹被识别选中,并且被准确分割。完成这项操作的是Meta最新发布的视觉分割模型SAM2(Segment Anything Model 2),该模型在原有的SAM模型基础上升级了架构,提高了分割准确率。Meta在公开新闻稿中称,「SAM 2是第一个用于实时、可提示的图像和视频对象分割的统一模型,可以分割任何视频或图像中的任何对象,应用于从未见过的视觉内容,无需自定义调整。」
扎克伯格分享了模型的行业应用:科学家用它研究珊瑚礁、自然栖息地以及景观的演变。黄仁勋提到了一个更易于理解的应用场景——仓库管理,「AI在仓库里监视一切,假设一堆箱子掉了,或者有人洒水,AI会识别出来并生成文本。如果发生事故,AI不会用视频记录所有内容,它只会记录重要的东西,因为它知道自己在看什么。」
智能眼镜或许是个好生意
苹果推出Vision Pro后,空间计算成为技术圈的关注热点,市场上既有苹果Vision Pro为代表的头戴式设备,也有Rokid和XREAL推出的AR眼镜,但空间计算产品将呈现出怎样的形态,业内还没有标准答案。去年10月,Meta发布了Quest 3头显。目前,扎克伯格更看好的产品形态是智能眼镜:「人们更容易接受智能眼镜,因为现在世界上戴眼镜的人(超过10亿)最终都会升级到智能眼镜。」
在这条赛道上,Meta细分出了两条发展路线:其一,专注具有全息显示功能的AR眼镜路线,但这条路线涉及到定制芯片、显示技术等高度专业化的开发,目前还无法像普通眼镜一样轻薄。扎克伯格透露,Meta在接下来的几年里会逐步将全息AR眼镜落实为一款成熟产品,不过初期产品的价格仍然会非常高。
其二,Meta与眼镜制造商巨头Luxottica集团合作,从制造时尚眼镜开始,短期内先占领市场。「雷朋Meta」眼镜就是Meta、太阳镜品牌雷朋、Luxottica三方合作的产物,目前已经研发到了第二代。今年4月,Meta向雷朋Meta眼镜的北美用户开放了Meta AI的智能助手功能。熟悉该产品供应链的人称,这款眼镜的出货量已经接近100万。不过,眼镜作为搭配穿搭的时尚单品,不是所有人都希望自己的眼镜和别人的一样。扎克伯格开玩笑称,「可能就要让那个每天穿同样衣服的我退休了」,扎克伯格认为,人们对形态和风格多样性的需求将会非常巨大,就像Meta开源营造的生态系统那样。