

祝贺
|Congratulations
近日,北京大学2025年优秀博士学位论文评选结果确定,计算机学院共3篇论文获评北京大学2025年优秀博士学位论文,PKU-DAIR实验室2025届博士毕业生张海林的学位论文《深度学习中大规模嵌入向量的管理技术研究》入选,指导教师为崔斌教授。
另外,2025年北京大学优秀本科毕业论文和信息科学技术学院2021级本科生“十佳”优秀毕业论文评选结果确定。PKU-DAIR实验室本科毕业生凌宿寒的学位论文《支持长视频生成的高效免训练自适应稀疏注意力方法》入选,指导老师为崔斌教授。

祝 贺

张海林(左)与导师崔斌教授(右)

2025年北京大学优秀博士学位论文名单
个人简介与论文概述
介
绍
张海林介绍
Personal introduction
张海林博士(2020级信息科学技术学院博士研究生),导师为北京大学计算机学院副院长崔斌教授,主要研究方向是机器学习系统,目前已发表10余篇CCF-A类文章,其中7篇第一作者/共同一作论文,一作/共一文章曾获得数据库顶级会议VLDB的可扩展数据科学最佳论文奖、SIGMOD的最佳代码实现提名奖。他是开源高性能分布式深度学习系统河图的主要代码贡献者,有多项研究成果已在腾讯、微软、小米等业界场景得到应用。他曾获得北京大学优秀毕业生、北京大学校长奖学金、北京大学三好学生等荣誉。
概
述
博士学位论文概述
PhD thesis
张海林的博士学位论文主要研究深度学习中大规模嵌入向量的管理技术,选题具有重要的理论意义和实践价值。深度学习中的嵌入向量规模快速增长,带来管理挑战。文章针对嵌入向量在模型输出、输入和中间表示中的不同应用场景,提出三种优化技术:
1)提出生成模型增强的向量索引,对于模型输出向量的检索,结合生成模型与传统检索,实现高效两阶段搜索,提升效果且保持低延迟。
2)提出紧凑、适应性、快速的嵌入向量压缩框架,对于模型输入向量的训练,动态追踪重要特征、并分配存储资源,满足高存储效率、低延迟、适应性。
3)提出基于乘积量化的键值缓存管理技术,对于大语言模型缓存的向量,用乘积量化管理并选择重要token进行计算,平衡推理效率与质量。

祝 贺

凌宿寒(左)与崔斌教授(右)

2025年北京大学优秀本科毕业论文评选结果(信科部分)

信息科学技术学院2021级本科生“十佳”优秀毕业论文评选结果
个人简介与论文概述
介
绍
凌宿寒介绍
Personal introduction
凌宿寒(2021级信息科学技术学院本科毕业生),将于2025年9月进入北京大学计算机学院攻读博士学位,导师为北京大学计算机学院副院长崔斌教授,研究方向为机器学习系统。本科期间已发表2篇学术论文,并曾获得北京大学三好学生等荣誉。未来将继续在分布式深度学习系统优化、高效推理等方向开展研究。
概
述
本科学位论文概述
Bachelor thesis
凌宿寒的毕业论文针对Diffusion Transformer(DiT)在视频生成过程中面临的注意力计算效率瓶颈问题,提出了一种创新的AdaSpa优化方案。该研究通过分析DiT固有的层次化稀疏特征,设计了基于块状稀疏表征的高效注意力计算范式;同时利用去噪过程中稀疏模式的不变性,实现了在线精确搜索与实时计算优化;并创新性地引入分步调度策略,根据去噪阶段的重要性差异动态分配计算资源。实验结果表明,AdaSpa方案在不影响生成视频质量的前提下,能够稳定实现1.7-1.8倍的加速效果,为解决高质量视频生成的实时性问题提供了实用且高效的解决方案。
欢迎关注本公众号,帮助您更好地了解北京大学数据与智能实验室(PKU-DAIR),第一时间了解PKU-DAIR实验室的最新成果!
北京大学数据与智能实验室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR实验室)由北京大学计算机学院崔斌教授领导,长期从事数据库系统、大数据管理与分析、人工智能等领域的前沿研究,在理论和技术创新以及系统研发上取得多项成果,已在国际顶级学术会议和期刊发表学术论文200余篇,发布多个开源项目。课题组同学曾数十次获得包括CCF优博、ACM中国优博、北大优博、微软学者、苹果奖学金、谷歌奖学金等荣誉。PKU-DAIR实验室持续与工业界展开卓有成效的合作,与腾讯、阿里巴巴、苹果、微软、百度、快手、中兴通讯等多家知名企业开展项目合作和前沿探索,解决实际问题,进行科研成果的转化落地。
内容中包含的图片若涉及版权问题,请及时与我们联系删除