热点
"后训练" 相关文章
训练效率提升100%!阿里云后训练全栈解决方案发布实录
掘金 人工智能 2025-07-23T06:19:00.000000Z
英伟达大牛主讲!斯坦福吴恩达:大语言模型的后训练课程全网发布
Datawhale 2025-07-20T08:43:56.000000Z
大模型竞赛转向:决胜关键为何是“后训练”?|甲子光年
甲子光年 2025-07-18T13:13:07.000000Z
【华福计算机】KI­MI K2——尚未到达的通用模型天花板 ,提升点在哪?
韭研公社 2025-07-18T01:05:33.000000Z
Perplexity CEO表示或将利用Kimi K2进行后训练。美国AI搜索初创公司Perplexity CEO阿拉温德(Aravind Srinivas)在社交媒体表示,基于Kimi K2模型的良好表现,公...
虎嗅 2025-07-13T06:37:15.000000Z
Perplexity CEO表示或将利用Kimi K2进行后训练
深度 2025-07-13T06:28:42.000000Z
英伟达大牛主讲!斯坦福吴恩达:大语言模型的后训练课程全网发布
Datawhale 2025-07-10T16:57:13.000000Z
Reinforcement Fine-Tuning Naturally Mitigates Forgetting in Continual Post-Training
cs.AI updates on arXiv.org 2025-07-09T04:01:40.000000Z
喝点VC|红杉美国对谈OpenAI前研究主管:预训练已经进入边际效益递减阶段,其真正杠杆在于架构的改进
Z Potentials 2025-07-08T06:14:09.000000Z
Can We Improve Llama 3’s Reasoning Through Post-Training Alone? ASTRO Shows +16% to +20% Benchmark Gains
MarkTechPost@AI 2025-07-04T17:20:50.000000Z
10步优化超越强化学习,仅需1条未标注数据!后训练强势破局
智源社区 2025-06-05T16:22:55.000000Z
阿里Qwen3技术报告核心要点解读!
PaperAgent 2025-05-15T12:07:53.000000Z
我在 Character.ai 做 Post Training|42章经
42章经 2025-05-14T18:11:36.000000Z
32B 稠密模型推理能力超越 R1?中国秘密 AI 团队发布推理小模型 AM-Thinking-v1
AI科技评论 2025-05-14T14:24:30.000000Z
后训练时代如何延续Scaling Law?这是你该读的LLM后训练综述
机器之心 2025-05-01T09:46:16.000000Z
Qwen3术语解密:读懂大模型黑话
掘金 人工智能 2025-04-30T02:23:00.000000Z
375篇文献,深入探究推理大模型后训练技术
PaperAgent 2025-03-11T12:13:54.000000Z
Elicitation, the simplest way to understand post-training
Interconnects 2025-03-10T16:41:36.000000Z
Character training and the secret arts of post-training
Interconnects 2025-02-26T13:14:38.000000Z
黄仁勋笑了!DeepSeek爆火最大受益者是英伟达:特供H20芯片在中国订单大增
最新-新浪科技科学探索 2025-02-25T03:48:05.000000Z