IT之家 2024年07月28日
阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里大模型元老杨红霞已入职香港理工大学,担任电子计算机系教授。杨红霞是 AI 领域知名科学家,曾领导通义千问前身 M6 大模型的研发,并推动了 M6 从百亿参数量进化到万亿规模,也曾担任字节跳动大语言模型研发技术专家。她的加入将为香港理工大学的 AI 研究注入新的活力。

👨‍🏫 杨红霞是 AI 领域知名科学家,曾领导通义千问前身 M6 大模型的研发,并推动了 M6 从百亿参数量进化到万亿规模,也曾担任字节跳动大语言模型研发技术专家。她拥有丰富的经验和深厚的技术积累,在 AI 研究领域有着重要的影响力。

🏢 杨红霞入职香港理工大学,担任电子计算机系教授,将为香港理工大学的 AI 研究注入新的活力。她的加入将促进该校在 AI 领域的科研发展,培养更多优秀人才。

🚀 杨红霞的加入也引发了人们对 AI 人才流动趋势的思考。随着 AI 技术的快速发展,越来越多的 AI 人才选择从企业转向学术界,这将加速 AI 技术的创新和应用。

💡 杨红霞此前曾表示,她将继续从事 AI 领域的研究工作,并希望将自己的经验和知识应用到更具体的 AI 细分领域。她选择入职香港理工大学,或许也与她希望将科研成果转化为实际应用有关。

🎓 杨红霞的经历也反映了 AI 人才流动趋势的变化。越来越多的 AI 人才选择从企业转向学术界,这将加速 AI 技术的创新和应用。杨红霞的加入将为香港理工大学的 AI 研究注入新的活力,并促进该校在 AI 领域的科研发展。

最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。

杨红霞是 AI 领域知名科学家。她曾在 IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016 年加入阿里巴巴,就职于达摩院智能计算实验室;2023 年 3 月入职字节跳动。

她在达摩院期间领导了通义千问前身 M6 大模型的研发,是 M6 大模型从百亿、千亿参数量进化到万亿规模的主要功臣,并领导通义大模型核心技术“统一学习范式 OFA-M6”的开发。

任职字节期间,她主要负责大模型研发,向字节 AML 和豆包大模型 Foundation 团队负责人项亮汇报。

今年 5 月,杨红霞被曝从字节跳动离职,有传闻称她将进行大模型领域创业。如今,更先一步曝光了她进军学术圈的消息。此前杨红霞未曾在高校内有正式任职,仅担任过浙江大学上海高级研究院兼职教授。

通义千问奠基人物

杨红霞本科毕业于南开大学统计学专业。博士就读于杜克大学。在顶级会议和期刊上发表论文 100 余篇,在美国和中国拥有 50 多项专利。主要研究方向为贝叶斯统计、时间序列分析、时空建模、生存分析、机器学习、数据挖掘及其在商业分析和大数据中的应用。

博士毕业后,她最先在 IBM T.J.沃森研究中心担任研究人员。之后来到雅虎担任计算广告首席数据科学家,负责开发广告投放预测相关算法。

2016 年,杨红霞回国入职阿里巴巴,就职于达摩院智能计算实验室。在此期间她最重要的工作是推动了 M6 大模型的研发和扩展。这一多模态模型是通义千问的前身,也是构建阿里当下大模型竞争力的关键基础工作。

M6 项目在启动研发 1 年时间左右,快速完成从亿级到十万亿级规模扩展。2020 年 6 月项目启动,2021 年 5 月发布万亿参数规模 M6 并投入使用,2021 年 10 月 M6 正式成为全球首个 10 万亿参数多模态大模型。

不仅成为当时世界上最大的中文多模态模型,并且快速追赶上谷歌的发展脚步,在文生图、商业化等领域达到世界一流水平。而且在绿色低碳方面,相比 GPT-3,M6 实现了同等参数规模下所需能耗仅为 1%。

这项工作由阿里和清华共同开发,杨红霞、唐杰共同担任通讯作者。

其他主要成员,正是通义千问研发的核心成员,比如 An Yang、Rui Men。M6 的共同一作林俊旸是目前通义千问开源负责人。

2022 年 9 月,达摩院正式发布“通义”大模型系列,打造业界首个 AI 通义底座,并构建了大小模型协同的层次化人工智能系统。其中统一底座的 M6-OFA 模型由杨红霞领导完成。它在业界首次实现模态表示、任务表示、模型结构统一。不引入新增结构,单一模型就可以同时处理超过 10 项跨模态任务,升级后可以处理超过 30 种。这项工作对外开源,目前被引用数超过 900+,GitHub 星标 2.4k。

而就在这项重磅发布 1 个月后,杨红霞被曝因家庭原因从达摩院离职。

下一次新动向已是 2023 年 3 月。消息称她已加入字节 AML(机器学习系统)团队,任字节跳动大语言模型研发技术专家,在美国西雅图从事大语言模型的研发。

不过短短 1 年时间,她就又从字节离职。与此同时,行业的风向也从基础大模型开发,逐渐转向更细分的应用落地方向。

同步筹备全球化 AI 项目

值得一提的是,此前杨红霞的下一站被猜测是“端侧模型创业”,布局 AI Agent。5 月消息称,团队正在筹备组建中,已获得 3000-4000 万美元投资,投后估值 1.5 亿美元。

最近量子位从知情人士处获悉,杨红霞前不久还在西雅图筹备全球化 AI 项目。综合来看,杨红霞入职香港理工大学,可能和创业动作并不冲突。

值得一提的是,从事更具体的 AI 细分领域大展拳脚,确实是目前 AI 人才再创业比较集中的选择。比如漆远的创业方向选择了可信大模型。从蚂蚁集团副总裁任上离职后,漆远先是重返学界,在复旦担任教职,而后又产学研并行地创立了大模型公司无限光年

此前,量子位从市场获悉更多消息如下:

如上或有缺漏与误传,欢迎评论区留言指正、分享更多行业信息。

参考链接:

本文来自微信公众号:量子位(ID:QbitAI),作者:明敏

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

杨红霞 阿里大模型 通义千问 M6 香港理工大学
相关文章