2025 Meet AI Compiler 第 7 期技术沙龙将于 7 月 5 日在北京市中关村举办。
HyperAI超神经将于 7 月 5 日在北京市中关村举办第 7 期 Meet AI Compiler 技术沙龙。本次活动邀请了来自 AMD、沐曦集成电路、字节跳动、北京大学的 4 位资深专家,从底层编译到上层应用,多视角探索 AI 编译器的前沿实践。此外,上海创智学院助理教授、Apache TVM PMC 冯思远将担任圆桌环节的主持人,与众位讲师一起围绕「跨硬件的统一编译生态」这一主题展开深入讨论。
活动当天我们还为大家准备了精美礼品与茶歇,报名活动并关注「HyperAI超神经」公众号,后台回复「0705」即可参与抽奖,奖品需在 7 月 5 日当天活动现场线下领取哦,快来参与吧~
活动详情
⏰ 时间:7 月 5 日(周六)13:30-17:45
📍 地点:北京市海淀区海淀西大街 48 号车库咖啡
👬 人数:200(现场座位有限,请尽早报名)
🙌🏻 报名:点击下方小程序报名
扫码备注「AI 编译器」加入活动群:

📝 议程:
嘉宾及议程
环节 1
分享嘉宾

13:40-14:20
张宁
AMD
AI 架构师
分享主题:助力开源社区,剖析 AMD Triton 编译器
内容简介:Triton是OpenAI提出的一种专为简化高性能GPUKernel开发而设计的编程语言,在主流的LLM推理训练框架中得到了广泛应用。用户可以通过开发PythonTriton代码来实现GPUKernel,无需关心底层的GPU架构细节,大大降低了GPU代码的开发难度。
AMD 在相关的 GPU 平台上实现了 Triton 编译器,并且贡献给了 Triton 开源社区。为了优化 GPU 代码性能,需要了解 Triton 编译器及其在 Kernel 性能优化中的作用。本次分享将详细探讨 AMD Triton 编译器,介绍 编译器如何提升 Triton 在 AMD GPU 平台上的性能。
观看本场分享,你将了解:
1. AMD GPU 架构的介绍
2. AMD GPU 在 Triton 开源社区上的最新工作

14:20-15:00
董兆华
沐曦集成电路
高级总监
分享主题:沐曦 GPU 上的 TVM 应用实践
内容简介:这次讨论主要围绕如何在沐曦 GPU 上应用 TVM。针对沐曦 GPU,围绕 TVM 进行高性能算子生成,使能基于 TVM 的主流 AI 框架。
观看本场分享,你将了解:
1. 国产 GPGPU 上适配 TVM 可能会碰到的问题
2. TVM 在国产 GPGPU 上的收益如何,以及哪些方面需要继续突破
3. 关于 TVM 等 AI 编译器在国产 GPGPU 上的支持现状,并讨论如何拓展相关生态圈

15:15-15:55
郑思泽
字节跳动 TopSeed
Research Scientist
分享主题:Triton-distributed: 原生 Python 编程实现高性能通信
内容简介:单芯片规模化渐至瓶颈,单加速器难支撑大语言模型训练推理,分布式系统成刚需。分布式系统中计算、内存访问、通信并发,但现有框架多独立优化,难以协同释放集群性能。
本报告提出 Triton-distributed(Triton 编译器扩展),首倡分布式 AI 工作负载原生重叠优化,覆盖多框架优化。通过集成 OpenSHMEM 通信原语、借助编译器实现三项活动联合优化、展示重叠技术应用及单 / 多节点编程方法,其生成代码在集群环境中充分利用异构资源,性能超越手工优化代码,且开发成本显著低于 CUDA/C++。
观看本场分享,你将了解:
1. Triton-distributed最新技术
2. 从Python编程通信的挑战
3. 分布式编译未来方向

15:55-16:35
杨智
北京大学
计算机学院副研究员
分享主题:TileLang:算子开发不再「烧脑」,性能依然在线
内容简介:本次分享我们带来新的算子编程语言——TileLang。它通过显式的 tile 级原语与自动推理机制,赋能开发者高效实现硬件感知的神经算子,兼顾控制力与开发效率。与传统编译器(如 Triton)相比,TileLang 在主流 GPU 上可实现高达 6 倍的性能提升,显著简化开发流程,让性能优化不再是「专家专属」。
观看本场分享,你将了解:
1. 掌握一种更简单、更高效的高性能算子开发语言
2. 了解 TileLang 的核心设计理念与技术优势
环节 2
圆桌讨论
圆桌主题:跨硬件的统一编译生态

主办方及合作伙伴

HyperAI超神经(hyper.ai)作为国际领先的人工智能及高性能计算社区,旨在通过提供行业资讯报道、数据集加速下载、在线教程演示、热门模型性能评测、前沿论文推荐、高价值成果解读、顶会日历集成等一系列服务,助力全球数据科学及⼈⼯智能⾏业的开发者及爱好者学习、理解、实践,与社区⼀起构建⼈⼯智能的未来。
访问官网:https://hyper.ai/

OpenBayes贝式计算是国内领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,进而为工业企业及高校科研提供更加快速、易用的数据科学计算产品,其产品已被数十家大型工业场景或头部科研院所所采用。
访问官网:https://openbayes.com/

MLC.AI 社区成立于 2022 年 6 月,并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇,带领团队上线了 MLC 线上课程,系统介绍了机器学习编译的关键元素以及核心概念。
2022 年 11 月,在 MLC.AI 社区志愿者的共同努力下,首个完整的 TVM 中文文档上线,并成功托管至 HyperAI超神经官网,进一步为对机器学习编译感兴趣的国内开发者,提供了接触并学习一门新技术的基础设置——文档。
MLC 线上课程:https://mlc.ai/
TVM 中文文档:https://tvm.hyper.ai/

车库咖啡成立于 2011 年 4 月,是中国最早关注早期互联网创业,面向早期创业者围绕“大众创业”打造低成本、便利化、全要素、开放式创新创业服务平
台。
作为北京中关村创业大街首家众创空间,车库咖啡以咖啡厅为交互载体,为创业团队提供共享、共促、共融、共生交互式办公空间与创孵配套服务。车库咖啡是全球第一家创业主题咖啡厅,是中国最具影响力的国家级众创空间和国际化创新创业平台。
活动支持

活动行:扫码跳转至活动行报名

扫码备注「AI 编译器」加入活动群

考虑到本场活动的场地空间情况,我们仅开放了 200 个到场名额,建议大家尽早报名锁定席位。
7 月 5 日 13:30-17:45,我们不见不散!
内容中包含的图片若涉及版权问题,请及时与我们联系删除