热点
"预训练" 相关文章
【AI大模型入门指南】概念与专有名词详解 (二)
掘金 人工智能 2025-06-11T15:15:39.000000Z
「Next-Token」范式改变!刚刚,强化学习预训练来了
掘金 人工智能 2025-06-11T10:43:35.000000Z
「Next-Token」范式改变!刚刚,强化学习预训练来了
机器之心 2025-06-11T06:38:29.000000Z
Transformer:BERT模型和代码解析
掘金 人工智能 2025-06-10T02:39:31.000000Z
为什么用错奖励,模型也能提分?新研究:模型学的不是新知识,是思维
36氪 - 科技频道 2025-06-09T02:54:16.000000Z
为什么用错奖励,模型也能提分?新研究:模型学的不是新知识,是思维
机器之心 2025-06-08T06:51:40.000000Z
既ZeroSearch之后,通义最新力作MaskSearch提出推理搜索预训练新框架
PaperWeekly 2025-06-08T06:37:42.000000Z
Pre-Training、Fine-Tuning、SFT、LoRA、RLHF之间有什么关系?
掘金 人工智能 2025-05-29T07:43:06.000000Z
Reinforcement learning with random rewards actually works with Qwen 2.5
Interconnects 2025-05-27T16:50:21.000000Z
OpenAI自曝:AI推理砸钱越多,碾压人类越狠!
智源社区 2025-05-20T02:52:49.000000Z
阿里Qwen3技术报告核心要点解读!
PaperAgent 2025-05-15T12:07:53.000000Z
别再卷数据了,LLM也怕「过劳死」!CMU等揭秘灾难性过度训练
智源社区 2025-05-05T01:38:03.000000Z
What's going on with AI progress and trends? (As of 5/2025)
少点错误 2025-05-02T19:07:26.000000Z
Qwen3术语解密:读懂大模型黑话
掘金 人工智能 2025-04-30T02:23:00.000000Z
52 页 PPT,谷歌 Gemini 预训练负责人首次揭秘!扩展定律最优解
掘金 人工智能 2025-04-29T03:22:54.000000Z
字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题
机器之心 2025-04-28T12:06:15.000000Z
字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题
掘金 人工智能 2025-04-28T10:47:55.000000Z
Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用
智源社区 2025-04-23T11:58:50.000000Z
《AI 的下半场》 最近非常重要的一篇文章 来自一线的 OpenAI 的 Agent 研究员 yaoshunyu 文中提出了一些反共识的 Inshgts: - 强化学习最重要的不是算法,而是先...
AI探索站 - 即刻圈子 2025-04-20T05:14:00.000000Z
NVIDIA Introduces CLIMB: A Framework for Iterative Data Mixture Optimization in Language Model Pretraining
MarkTechPost@AI 2025-04-19T21:15:38.000000Z