新智元报道
新智元报道
华南理工学霸开启GPT-4o生图狂欢
在OpenAI担任研究科学家期间,Lu Liu是GPT-4o图像生成功能的核心创始研究员之一。此前,她曾在Character AI和Google DeepMind从事多模态领域的研究工作。2025年3月26日,可以说就是她、Allan Jabri和其他参与直播的小伙伴们,与奥特曼一同开启了「吉卜力」狂欢。热潮迅速席卷全球,吸引了众多名人乃至政府官方X账号的参与。Lu Liu展示了如何使用GPT-4o进行图片上传和风格迁移。在GPT-4o生图的贡献名单里,Lu Liu和Allan Jabri都负责的是基础研究。加入OpenAI之前,Lu Liu在Character.ai负责音频生成的研究工作,并主导开发了其首个语音功能「Character Voice For Everyone」。再之前,Lu Liu在Google DeepMind的图像感知团队工作,开发的模型已被集成到多款谷歌产品中,为全球数十亿用户提供服务。Lu Liu的第一份全职工作始于毕业后加入加州山景城的谷歌总部。那个让谷歌在AI大战中彻底翻身的Gemini,背后就有她的身影。她的求学之路横跨三大洲,先后在国内、澳大利亚和加拿大的高校就读,主攻机器学习和深度学习领域的通用表征学习方向。在悉尼科技大学获得机器学习博士学位在华南理工大学获得电子工程学士学位,专业排名:1/53(嗯,妥妥的学霸)
GPT-4o的关键领队之一
除了Lu Liu,Meta这次还从OpenAI那里挖走了另一位负责多模态AI研究的专家——Allan Jabri。除了刚刚提到的生图之外,回看最初GPT-4o的贡献列表可以发现,Allan Jabri当时就已经是多模态团队的解码器负责人了。Allan Jabri在普林斯顿大学获得计算机科学学士学位,并在加州大学伯克利分校电子工程与计算机科学系获得博士学位,师从Alexei A. Efros教授。在校期间,他是伯克利人工智能研究所(BAIR)的成员,并获得了PD Soros学者奖金。Allan Jabri的主要研究方向是用于自监督学习和无监督学习的可扩展目标函数与模型架构。他曾先后在伦敦的DeepMind和谷歌大脑(Google Brain)担任研究实习生,并曾是纽约Facebook人工智能研究院(FAIR)的一名研究工程师。近几周,Meta已从OpenAI、Anthropic和谷歌等多个竞争对手处招揽了一系列研究人员。算上Jabri和Liu,Meta已从ChatGPT的开发商那里挖走了至少十余名研究员。
罢免闹剧「后遗症」
所有人不禁想问,为什么扎克伯格就盯着OpenAI不放?他怎么不找谷歌或者Anthropic?这个现象的根结,这还得说回此前奥特曼和Ilya那次「罢免闹剧」。最终,在105小时后,奥特曼回归,Ilya公开道歉,几天后他就离职OpenAI,随后创办了SSI。可以看到当时这个事情的热度和对行业的影响是极其深远的。根据外媒的报道,自从那次罢免闹剧之后,或许OpenAI的「人心就散了」。随后,OpenAI员工经历了太多的Drama故事,比如Anthropic的「分拆」,员工选择了Anthropic。再比如,OpenAI的公司结构治理的波动和变化,甚至Hinton老人家都出来写公开信。也许扎克伯格正是深刻的「洞察」到这一点,所以将火力全部集中到OpenAI身上。
然而对于那些真正受此使命感驱动的人而言,公司内部已经经历了太多的动荡。比如奥特曼的解雇与复职,以及公司治理结构的变更等等。
这让大家的归属感大大降低,因此从OpenAI挖人要比从其他实验室更容易。
可以说OpenAI现在是「树大招风」,Meta的挖人手段据传又是那种不讲道理的「急速签约」。举个例子就是,给你开价1个亿,但是必须在15分钟内做出决定,否则这个开价就作废。面对动摇的理想、少了归属感的公司和巨额的签约资金,这谁能顶得住呢?只能说,最近这段时间,扎克伯格是最疯狂的,奥特曼是「最委屈」的那个人。
文章原文