2025-06-30 09:30 湖北
我是小冬瓜AIGC
X-R1
开源框架 | 现高校LLM对齐研究OpenAI
,Meta
等
💡 课程核心:该课程基于Pytorch,从零手撕DP、TP、PP、CP、EP等五大并行算法,并涵盖Backward梯度和ZeRO-adam等关键算法,旨在帮助学员深入理解LLM的底层原理。
🚀 实战项目:课程提供R1模型训练实操、Llama-3-8B/70B-DeepSpeed + RLHF + DPO + PPO实操等多个实战项目,学员可以低成本复现项目效果,并进行MMLU/Ceval测评。
📚 课程内容:课程包含直播、录播、手撕级Notebook、非调包Code、算法图解和PPT等多种形式,覆盖RL、RLHF、LLM加速、分布式训练、多模态VLM等多个专题。
🌍 社群支持:课程拥有LLM社群,学员主要来自海外,部分学员就职于OpenAI、Meta等知名公司,为学员提供交流和学习的平台。
2025-06-30 09:30 湖北
我是小冬瓜AIGC
X-R1
开源框架 | 现高校LLM对齐研究OpenAI
,Meta
等小红书
/知乎
:小冬瓜AIGC
纯 Pytorch 5
DP
、TP
、PP
、CP
、EP
。不依赖DeepSpeed
和Megatron
框架,手撕关键算法Backward
梯度和ZeRO-adam
,硬核实现 MoE EP 1F1B 下的 通信-计算重叠Step-by-step 手撕DP:ZeRO-3
、TP:Llama
、CP: RingAttention
、PP: DualPipe
、EP: Gshard
等经典算法不需要多卡环境,纯CPU GLOO backend可运行所有实例,无须 triton和cuda 等基础课程内容:直播 + 往期录播 + 手撕级Notebook + 非调包Code + 算法图解 + 课程PPT
课程项目:垂域大模型实操 + 多卡DeepSpeed RLHF训练 + R1模型训练实操⚠️进阶专题:手撕RL、手撕RLHF、手撕分布式训练、手撕多模态VLM、LLM加速、手撕RLHF-PPO Notebook实操效果:X-R1实操<50元成本出效果;已全线支持Llama-3-8B/70B的SFT/DPO/PPO多卡训练;低成本百元 8B DPO训练;LLM社群:学员超过50%来自海外。部分就业于北美OpenAI、谷歌Gemini、SEED、META、微软、亚麻、苹果、谷歌等,海外学历背景PhD居多,MIT、UCLA、UIUC、NYU、UCL等;国内清北、复旦居多。入门要求: Pytorch+神经网络或深度学习基础2.2【手撕LLM-第9/10章节】RL/RLHF
2.3【手撕LLM-第11章】LLM加速(长文档)
2.4【手撕LLM-第12章】分布式训练(长文档+代码)
2.5【手撕LLM-第13章】手撕多模态VLM(长文档+Notebook)
2.6【手撕LLM-第14章】手撕o1推理(长文档+Notebook+PRM实操)
分布式训练:DP、ZeRO1/2/3、GQATP、DualPipe、GShard、计算通信重叠等
Notebook:FlashAttention Backward、Cut Cross Entropy,MCTS, BPE, BeamSearch, AutoGrad, CrossEntropy, PPL, Layernorm Backward, Tensor Parallel, BTModel, DPO, IPO, KTO, NTK-RoPE, Llama-3-GQA, MoE测评:vllm推理部署、CMMLU、MMLU、CEVAL、safety测评三、课程内容在线直播授课+Notebook+源码工程+关键算法图解+课程PPT+课后答疑+完整垂域大模型实操项目+多卡Deepspeed+RLHF PPO实操+R1训练实操实操项目仓库MA-RLHF: 课程私密代码仓库,实操项目和手撕Notebook长期更新。xiaodongguaAIGC/X-R1-3B
xiaodongguaAIGC/xdg-llama-3-8B
从0搭建LLM,覆盖LLaMA-LoRA-Pretrain-sft-RM-RLHF
不依赖
DeepSpeed
和Megatron
框架,纯Pytorch
从零手撕5
大并行算法:DP
、TP
、PP
、CP
、EP
分布式训练算法。Backward
,手撕分布式gradient
和adam
,硬核实现MoEEP 1F1B 下的 通信-计算重叠Step-by-step 手撕DP:ZeRO-3
、TP:Llama
、CP: RingAttention
、PP: DualPipe
、EP: Gshard
等经典算法不需要多卡环境,纯CPU GLOO backend可运行所有实例,无须 triton和cuda 等基础手撕分布式训练所实现代码包含:git:dhcode-cpp/easy-dualpipe
。3.5 源码工程+Notebook
3.6 课程形式
四、LLM社群 & 教学成果4.1 部分教学成果
学员超过50%来自海外,北美PhD居多
部分学员就职:OpenAI、META、谷歌Gemini、微软、亚麻、苹果、谷歌、TikTok、高通和eBay等,部分阿里、百度、腾讯和华为等学历背景:海外MIT、UCLA、UIUC、NYU、UCL等;国内清北、复旦居多。我是小冬瓜AIGC
X-R1
开源框架 | 现高校LLM对齐研究课程帮助学员拿下OpenAI
,Meta
等小红书
/知乎
:小冬瓜AIGC
微信咨询xiaodongguaAIGC
AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。
鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑