热点
"后训练" 相关文章
Qwen3术语解密:读懂大模型黑话
掘金 人工智能 2025-04-30T02:23:00.000000Z
375篇文献,深入探究推理大模型后训练技术
PaperAgent 2025-03-11T12:13:54.000000Z
Elicitation, the simplest way to understand post-training
Interconnects 2025-03-10T16:41:36.000000Z
Character training and the secret arts of post-training
Interconnects 2025-02-26T13:14:38.000000Z
黄仁勋笑了!DeepSeek爆火最大受益者是英伟达:特供H20芯片在中国订单大增
最新-新浪科技科学探索 2025-02-25T03:48:05.000000Z
黄仁勋笑了!DeepSeek爆火最大受益者是英伟达:特供H20芯片在中国订单大增
快科技资讯 2025-02-25T01:46:20.000000Z
显卡并不愁卖?黄仁勋首次公开回应DeepSeek,点赞DeepSeek模型推理能力,指出后训练是“智能核心”
DeepTech深科技 2025-02-24T04:48:45.000000Z
显卡并不愁卖?黄仁勋首次公开回应DeepSeek,点赞DeepSeek模型推理能力,指出后训练是“智能核心”
MIT 科技评论 - 本周热榜 2025-02-23T16:16:47.000000Z
DeepSeek满血微调秘籍来了,全网首发打破低价内卷!解锁升级版全家桶
智源社区 2025-02-20T14:50:16.000000Z
ChatGPT后训练方法被OpenAI离职联创公开,PPT全网转~
智源社区 2025-02-20T00:07:12.000000Z
DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍
机器之心 2025-02-19T07:10:30.000000Z
How Scaling Laws Drive Smarter, More Powerful AI
Nvidia Blog 2025-02-16T15:07:07.000000Z
强化学习与大模型后训练:DeepSeek R1 如何获得推理能力?
智源社区 2025-02-07T10:03:47.000000Z
超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈
智源社区 2025-02-06T05:38:02.000000Z
年末重磅!ByteDance Research视频理解大模型「眼镜猴」正式发布
机器之心 2025-01-25T08:39:56.000000Z
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory
机器之心 2025-01-10T07:08:26.000000Z
The state of post-training in 2025
Interconnects 2025-01-08T13:36:22.000000Z
【NLP】关于大模型训练常见概念讲解
机器学习初学者 2024-12-20T06:40:51.000000Z
73页,开源「后训练」全流程!AI2发布高质量Tülu 3系列模型,拉平闭源差距,比肩GPT-4o mini
新智元 2024-12-12T09:00:39.000000Z
73页,开源「后训练」全流程,AI2发布高质量Tülu 3系列模型,拉平闭源差距,比肩GPT-4o mini
36kr 2024-12-10T12:18:33.000000Z