04月09日 18:40
清程极智联合创始人唐适之:低成本DeepSeek R1推理挑战与赤兔推理引擎实践|公开课预告
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

智猩猩公开课聚焦DeepSeek R1推理成本挑战,探讨如何降低私有化部署门槛。清程极智联合清华大学团队开源赤兔推理引擎,实现了在非H卡设备上运行原生FP8模型。实测显示,赤兔引擎在H800集群上部署DeepSeek R1时,GPU使用量减少50%,输出速度提升3.15倍。本次公开课由清程极智联合创始人唐适之博士主讲,将深入分析DeepSeek R1的算力需求,探讨有限资源下的大模型推理方案,并详细讲解赤兔引擎的FP8推理优化实践。

🧠 DeepSeek R1的推理能力强大,但计算资源消耗巨大,导致算力成本高昂,限制了其私有化部署。

🚀 清程极智联合清华大学团队开源了赤兔(Chitu)推理引擎,旨在降低DeepSeek R1的推理成本。

💡 赤兔引擎实现了在非H卡设备上运行原生FP8模型的突破,通过优化,降低了对GPU的需求。

⚡️ 实测数据显示,在H800集群上使用赤兔引擎部署DeepSeek R1,GPU使用量减少50%,输出速度提升3.15倍。

🔑 本次公开课将由清程极智联合创始人唐适之博士主讲,深入探讨DeepSeek R1的算力需求、有限硬件资源下的推理方案,以及赤兔引擎的FP8推理优化实践。

智猩猩公开课 2025-03-26 22:38 北京

DeepSeek R1具有强大的推理能力,能够通过多次推理和思考得出问题的最佳答案。但其中每一步推理和思考都

DeepSeek R1具有强大的推理能力,能够通过多次推理和思考得出问题的最佳答案。但其中每一步推理和思考都会消耗大量的计算资源,进而提高了单次推理的算力成本。如何缩减DeepSeek R1的推理算力成本,降低私有化部署门槛,是全行业共同面临的难题。


今年3月,清程极智联合清华大学翟季冬教授团队开源了大模型推理引擎赤兔(Chitu),率先实现了在非H卡设备运行原生FP8模型突破。实测数据显示,使用赤兔引擎在H800集群上部署满血版DeepSeek R1,相比于vLLM部署方案,能够在减少50%的GPU使用量的同时,将输出速度提升3.15倍。这意味着通过赤兔推理引擎,企业可以通过更少的硬件资源,实现更高的性能,大幅降低推理模型的私有化部署成本。


3月27日19点智猩猩「DeepSeek大解读」系列公开课第6期将开讲,由清程极智联合创始人唐适之博士主讲,主题为《低成本DeepSeek R1推理挑战与赤兔推理引擎实践》。


本次公开课,唐适之博士首先会对DeepSeek R1与日益增长的算力需求进行分析,并探讨有限硬件资源下的大模型推理取舍之道。之后,唐适之博士还会深入讲解开源大模型推理引擎“赤兔”如何降低DeepSeek R1推理所需的硬件成本,尤其是在更广泛GPU上的FP8数据类型的推理优化实践。



第6期信息


 主 题 

《低成本 DeepSeek R1 推理挑战与赤兔推理引擎实践》 

 提 纲 



1、DeepSeek R1 与日益增长的算力需求

2、有限硬件资源下的大模型推理取舍

3、“赤兔”方案:更广泛 GPU 上的 FP8 推理优化


 主 讲 人 


唐适之,清程极智联合创始人,清华大学计算机专业学士、博士,负责清程极智并行训练、推理框架、算子优化等各类技术研发。唐适之曾获全国信息学奥赛 NOI 金牌,曾为清华大学国际超算竞赛 ASC/ISC/SC 三冠团队成员,主要的学术研究领域包括编程语言、异构计算等,代表工作为 FreeTensor 编程框架。


 直 播 时 间 


3月27日19:00-20:00


直播预约


本期公开课将以视频直播形式在智猩猩GenAI视频号进行,大家可以点击下方视频号卡片,提前预约。



如何报名与入群


针对此次公开课,也会组建交流群。希望入群与更多同仁探讨的,可以扫描下方二维码添加小助手“小石头”,私信发送“DeepSeek06”。


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DeepSeek R1 推理引擎 赤兔 FP8 算力优化
相关文章