36kr 2024年07月17日
阿里通义千问大模型负责人周畅将离职创业 | 36氪独家
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里通义千问大模型技术负责人周畅将离开阿里云,投身创业。周畅是通义实验室算法团队的核心技术骨干之一,曾参与研发超大规模多模态预训练模型M6,并带领团队实现了参数数量和低碳训练模式的突破。他曾在手淘多个个性化推荐场景下,通过研发超大规模商品图表征算法APP、用户表征框架ATRank、基于自监督对比学习的向量召回算法CLRec系列,显著提升了推荐效果。随着国内大模型行业进入应用落地阶段,周畅的创业将为AI应用领域带来新的活力。

👨‍💻 周畅是阿里通义千问大模型技术负责人,他在深度学习、图挖掘和分布式计算领域拥有丰富的经验,并曾在机器学习、数据挖掘、数据库领域国际顶级会议上发表30余篇文章。

💪 周畅曾带领团队设计并实现了超大规模的多模态预训练模型M6,在参数数量和低碳训练模式上取得突破,展现出其在大型模型研发方面的能力。

🚀 周畅在手淘多个个性化推荐场景下,通过研发超大规模商品图表征算法APP、用户表征框架ATRank、基于自监督对比学习的向量召回算法CLRec系列,显著提升了推荐效果,证明了其技术落地能力。

💡 周畅的创业将为AI应用领域带来新的活力,他将利用自身经验和技术积累,探索大模型在不同场景下的应用,推动AI技术的进一步发展。

🌐 国内大模型行业已经进入应用落地阶段,市场普遍关注大模型如何落地到千行百业中,这将带动新一波AI人才的创业热潮。

作者 | 邓咏仪 周鑫雨

编辑 | 苏建勋 杨轩

36氪独家获悉,阿里通义千问大模型技术负责人周畅(花名:钟煌)将从阿里云离职,下场创业。

36氪了解到,周畅目前还在阿里云系统中,尚未正式离职。但36氪从多方独立信源处得知,周畅已确定要创业。一位消息人士对36氪表示,周畅或将投身于AI应用领域。

而另一位知情人士表示,周畅是通义实验室算法团队的核心技术骨干之一,属于正常离职。通义大模型的研发和开源工作还在进行中,目前通义实验室负责人为阿里云CTO周靖人。

对于上述信息,36氪向阿里云求证,截至发稿,暂无回复。

周畅为“通义千问”的大模型负责人,他于2012年本科毕业于复旦计算机科学与技术专业,2017年博士毕业于北京大学计算机软件与理论专业,而后加入阿里巴巴。他先后在达摩院任职算法专家,再到通义千问的大模型负责人。其专攻领域为深度学习、图挖掘和分布式计算,他在机器学习、数据挖掘、数据库领域国际顶级会议上发表30余篇文章,并担任NeurIPS/ICML/KDD/WWW等学术会议的审稿人。

阿里是国内最早成体系地投入在大模型领域里投入研发的大公司。2019年,阿里就在BERT路线的基础上推出了预训练大语言模型structBERT,而后在2021年推出了多模态大模型M6,再到如今的通义大模型家族。

达摩院下属的通义实验室,也是如今大模型圈内的“人才高地”。如前不久官宣创业的前字节模型技术研发负责人杨红霞,已加入Salesforce的前任实验室负责人司罗、通义视觉实验室负责人徐盈辉等等,都出自达摩院体系,这都是培养起阿里大模型团队的第一批顶尖AI人才。

周畅则是完整经历过阿里大模型演变历程的核心技术骨干。在2020-2021年间,他带领团队设计并实现了超大规模的多模态预训练模型M6,在参数数量和低碳训练模式上曾取得突破。

而更早之前,他曾研发超大规模商品图表征算法APP、用户表征框架ATRank、基于自监督对比学习的向量召回算法CLRec系列,这些技术都有落地到实际应用场景中——比如在手淘多个个性化推荐场景下,让效果获得大幅提升。

进入2024年,国内大模型行业已经进入走过萌芽期,基础大模型层已经格局出现——玩家包括大厂如阿里、字节、腾讯,创业公司如智谱AI、Minimax、月之暗面、百川智能等。市场普遍将关注度放在了AI应用一侧,关注大模型如何落地到千行百业中,这也会带动新一波AI人才的创业热潮。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

通义千问 大模型 AI应用 创业 周畅
相关文章