后训练_Fishai

热点

"后训练" 相关文章

训练效率提升100%！阿里云后训练全栈解决方案发布实录

掘金人工智能 2025-07-23T06:19:00.000000Z

英伟达大牛主讲！斯坦福吴恩达：大语言模型的后训练课程全网发布

Datawhale 2025-07-20T08:43:56.000000Z

大模型竞赛转向：决胜关键为何是“后训练”？｜甲子光年

甲子光年 2025-07-18T13:13:07.000000Z

【华福计算机】KIMI K2——尚未到达的通用模型天花板，提升点在哪？

韭研公社 2025-07-18T01:05:33.000000Z

Perplexity CEO表示或将利用Kimi K2进行后训练。美国AI搜索初创公司Perplexity CEO阿拉温德（Aravind Srinivas）在社交媒体表示，基于Kimi K2模型的良好表现，公...

虎嗅 2025-07-13T06:37:15.000000Z

Perplexity CEO表示或将利用Kimi K2进行后训练

深度 2025-07-13T06:28:42.000000Z

英伟达大牛主讲！斯坦福吴恩达：大语言模型的后训练课程全网发布

Datawhale 2025-07-10T16:57:13.000000Z

Reinforcement Fine-Tuning Naturally Mitigates Forgetting in Continual Post-Training

cs.AI updates on arXiv.org 2025-07-09T04:01:40.000000Z

喝点VC｜红杉美国对谈OpenAI前研究主管：预训练已经进入边际效益递减阶段，其真正杠杆在于架构的改进

Z Potentials 2025-07-08T06:14:09.000000Z

Can We Improve Llama 3’s Reasoning Through Post-Training Alone? ASTRO Shows +16% to +20% Benchmark Gains

MarkTechPost@AI 2025-07-04T17:20:50.000000Z

10步优化超越强化学习，仅需1条未标注数据！后训练强势破局

智源社区 2025-06-05T16:22:55.000000Z

阿里Qwen3技术报告核心要点解读！

PaperAgent 2025-05-15T12:07:53.000000Z

我在 Character.ai 做 Post Training｜42章经

42章经 2025-05-14T18:11:36.000000Z

32B 稠密模型推理能力超越 R1？中国秘密 AI 团队发布推理小模型 AM-Thinking-v1

AI科技评论 2025-05-14T14:24:30.000000Z

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

机器之心 2025-05-01T09:46:16.000000Z

Qwen3术语解密：读懂大模型黑话

掘金人工智能 2025-04-30T02:23:00.000000Z

375篇文献，深入探究推理大模型后训练技术

PaperAgent 2025-03-11T12:13:54.000000Z

Elicitation, the simplest way to understand post-training

Interconnects 2025-03-10T16:41:36.000000Z

Character training and the secret arts of post-training

Interconnects 2025-02-26T13:14:38.000000Z

黄仁勋笑了！DeepSeek爆火最大受益者是英伟达：特供H20芯片在中国订单大增

最新-新浪科技科学探索 2025-02-25T03:48:05.000000Z

Copyright © 2019 FISHAI.All Rights Reserved