2025 Meet AI Compiler 第 7 期技术沙龙将于 7 月 5 日在北京市中关村举办。

HyperAI超神经将于 7 月 5 日在北京市中关村举办第 7 期 Meet AI Compiler 技术沙龙。本次活动邀请了来自 AMD、沐曦集成电路、字节跳动、北京大学的 4 位资深专家,从底层编译到上层应用,多视角探索 AI 编译器的前沿实践。此外,上海创智学院助理教授、Apache TVM PMC 冯思远将担任圆桌环节的主持人,与众位讲师一起围绕「跨硬件的统一编译生态」这一主题展开深入讨论。

活动当天我们还为大家准备了精美礼品与茶歇,报名活动并关注「HyperAI超神经」公众号,后台回复「0705」即可参与抽奖,奖品需在 7 月 5 日当天活动现场线下领取哦,快来参与吧~

活动详情

⏰ 时间:7 月 5 日(周六)13:30-17:45

📍 地点:北京市海淀区海淀西大街 48 号车库咖啡

👬 人数:200(现场座位有限,请尽早报名) 

🙌🏻 报名:点击下方小程序报名

扫码备注「AI 编译器」加入活动群:

📝 议程:

嘉宾及议程

环节 1

分享嘉宾

13:40-14:20

张宁

AMD

AI 架构师

分享主题:助力开源社区,剖析 AMD Triton 编译器

内容简介:Triton是OpenAI提出的一种专为简化高性能GPUKernel开发而设计的编程语言,在主流的LLM推理训练框架中得到了广泛应用。用户可以通过开发PythonTriton代码来实现GPUKernel,无需关心底层的GPU架构细节,大大降低了GPU代码的开发难度。

AMD 在相关的 GPU 平台上实现了 Triton 编译器,并且贡献给了 Triton 开源社区。为了优化 GPU 代码性能,需要了解 Triton 编译器及其在 Kernel 性能优化中的作用。本次分享将详细探讨 AMD Triton 编译器,介绍 编译器如何提升 Triton 在 AMD GPU 平台上的性能。

观看本场分享,你将了解:

1. AMD GPU 架构的介绍

2. AMD GPU 在 Triton 开源社区上的最新工作

14:20-15:00

董兆华

沐曦集成电路

高级总监

分享主题:沐曦 GPU 上的 TVM 应用实践

内容简介:这次讨论主要围绕如何在沐曦 GPU 上应用 TVM。针对沐曦 GPU,围绕 TVM 进行高性能算子生成,使能基于 TVM 的主流 AI 框架。

观看本场分享,你将了解:

1. 国产 GPGPU 上适配 TVM 可能会碰到的问题

2. TVM 在国产 GPGPU 上的收益如何,以及哪些方面需要继续突破

3. 关于 TVM 等 AI 编译器在国产 GPGPU 上的支持现状,并讨论如何拓展相关生态圈

15:15-15:55

郑思泽 

字节跳动 TopSeed 

Research Scientist

分享主题:Triton-distributed: 原生 Python 编程实现高性能通信

内容简介:单芯片规模化渐至瓶颈,单加速器难支撑大语言模型训练推理,分布式系统成刚需。分布式系统中计算、内存访问、通信并发,但现有框架多独立优化,难以协同释放集群性能。

本报告提出 Triton-distributed(Triton 编译器扩展),首倡分布式 AI 工作负载原生重叠优化,覆盖多框架优化。通过集成 OpenSHMEM 通信原语、借助编译器实现三项活动联合优化、展示重叠技术应用及单 / 多节点编程方法,其生成代码在集群环境中充分利用异构资源,性能超越手工优化代码,且开发成本显著低于 CUDA/C++。

观看本场分享,你将了解:

1. Triton-distributed最新技术

2. 从Python编程通信的挑战

3. 分布式编译未来方向

15:55-16:35

杨智 

北京大学

计算机学院副研究员

分享主题:TileLang:算子开发不再「烧脑」,性能依然在线

内容简介:本次分享我们带来新的算子编程语言——TileLang。它通过显式的 tile 级原语与自动推理机制,赋能开发者高效实现硬件感知的神经算子,兼顾控制力与开发效率。与传统编译器(如 Triton)相比,TileLang 在主流 GPU 上可实现高达 6 倍的性能提升,显著简化开发流程,让性能优化不再是「专家专属」。

观看本场分享,你将了解:

1. 掌握一种更简单、更高效的高性能算子开发语言

2. 了解 TileLang 的核心设计理念与技术优势

环节 2

圆桌讨论

圆桌主题:跨硬件的统一编译生态

主办方及合作伙伴

HyperAI超神经(hyper.ai)作为国际领先的人工智能及高性能计算社区,旨在通过提供行业资讯报道、数据集加速下载、在线教程演示、热门模型性能评测、前沿论文推荐、高价值成果解读、顶会日历集成等一系列服务,助力全球数据科学及⼈⼯智能⾏业的开发者及爱好者学习、理解、实践,与社区⼀起构建⼈⼯智能的未来。

访问官网:https://hyper.ai/

OpenBayes贝式计算是国内领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,进而为工业企业及高校科研提供更加快速、易用的数据科学计算产品,其产品已被数十家大型工业场景或头部科研院所所采用。

访问官网:https://openbayes.com/

MLC.AI 社区成立于 2022 年 6 月,并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇,带领团队上线了 MLC 线上课程,系统介绍了机器学习编译的关键元素以及核心概念。

2022 年 11 月,在 MLC.AI 社区志愿者的共同努力下,首个完整的 TVM 中文文档上线,并成功托管至 HyperAI超神经官网,进一步为对机器学习编译感兴趣的国内开发者,提供了接触并学习一门新技术的基础设置——文档。

MLC 线上课程:https://mlc.ai/

TVM 中文文档:https://tvm.hyper.ai/

车库咖啡成立于 2011 年 4 月,是中国最早关注早期互联网创业,面向早期创业者围绕“大众创业”打造低成本、便利化、全要素、开放式创新创业服务平

台。

作为北京中关村创业大街首家众创空间,车库咖啡以咖啡厅为交互载体,为创业团队提供共享、共促、共融、共生交互式办公空间与创孵配套服务。车库咖啡是全球第一家创业主题咖啡厅,是中国最具影响力的国家级众创空间和国际化创新创业平台。

活动支持

活动行:扫码跳转至活动行报名

扫码备注「AI 编译器」加入活动群

考虑到本场活动的场地空间情况,我们仅开放了 200 个到场名额,建议大家尽早报名锁定席位。

7 月 5 日 13:30-17:45,我们不见不散!

内容中包含的图片若涉及版权问题,请及时与我们联系删除