报告主题:大模型框架和路线图解读,一站式了解《大语言模型》

报告日期:01月07日(本周二)14:30-15:30

报告要点:

《大语言模型》梳理了自2019年以来各大学术机构的大模型发展历程,可以看到近三年大模型的井喷式发展。本书内容基本全覆盖大语言模型训练与使用全流程,从预训练到微调与对齐,从实用技术到评测应用,帮助读者全面掌握大语言模型的核心技术。本次报告将主要围绕三个主题:
    近年来大模型的发展历程与关键技术;
    利用大模型的配套代码与工具;
    探讨未来大模型的趋势与应用。

码购买图书?

论文GitHub页面:https://github.com/RUCAIBox/LLMSurvey

大模型开发代码库LLMBox:https://github.com/RUCAIBox/LLMBox

玉兰大模型YuLan:https://github.com/RUC-GSAI/YuLan-Chat

“A Survey of Large Language Models”综述论文链接:https://arxiv.org/abs/2303.18223

日程安排:

时间
内容
14:30-14:45

大语言模型发展历程

李军毅

14:45-15:00

大语言模型配套代码与工具

唐天一

15:00-15:30

自由交流和在线问答

李军毅、唐天一

报告嘉宾:

李军毅,新加坡国立大学研究员,中国人民大学博士,研究方向为自然语言处理与大语言模型,曾在国际期刊与会议ACL、NeurIPS、EMNLP、ACM Computing Surveys以第一作者身份发表多篇论文,担任多个国际会议的审稿人与领域主席,博士论文入选中国中文信息学会博士学位论文激励计划。

唐天一,毕业于中国人民大学,目前就职于阿里巴巴通义千问团队。师从导师赵鑫教授,研究方向为自然语言处理和大语言模型,发表论文20余篇,谷歌学术引用量4000余次;作为核心成员参与Qwen2.5训练,曾主导研发了LLMBox(大语言模型工具包)、TextBox(文本生成工具包)、MVP(预训练模型)等开源项目。曾获国家奖学金、北京市优秀毕业生、吴玉章奖学金(中国人民大学最高荣誉)、CCSP金奖、ACM银奖等荣誉。

扫码报名直播?

更多热门报告

内容中包含的图片若涉及版权问题,请及时与我们联系删除