热点
"RFT" 相关文章
AI Agent迈向中央舞台:深度解析2025年进化新格局
36氪 - 科技频道 2025-05-26T08:34:13.000000Z
ChatGPT Codex,OpenAI的第二款RFT训练的Agent
孔某人的低维认知 2025-05-18T12:08:39.000000Z
GPT-5研发内幕首曝!OpenAI首席研究官:AGI指日可待
智源社区 2025-05-13T11:13:58.000000Z
OpenAI Releases Reinforcement Fine-Tuning (RFT) on o4-mini: A Step Forward in Custom Model Optimization
MarkTechPost@AI 2025-05-09T04:20:10.000000Z
OpenAI推Pioneers Program,助企業打造AI專家模型與產業評測標準
AI & Big Data 2025-04-11T13:40:56.000000Z
DeepSeek更新了
调研纪要 2025-03-24T20:29:34.000000Z
模型层与应用层的边界正在模糊
孔某人的低维认知 2025-03-03T16:29:45.000000Z
GRPO 实验经验笔记(1)
孔某人的低维认知 2025-02-19T23:26:24.000000Z
OpenAI学会了如何构建Agent应用——评Deep Research
孔某人的低维认知 2025-02-06T16:10:30.000000Z
從十二天發表來看OpenAI的2025戰略布局
AI & Big Data 2025-01-22T03:46:25.000000Z
LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破
智源社区 2024-12-24T11:36:55.000000Z
被OpenAI带火的强化微调RFT技术解析~
PaperAgent 2024-12-08T08:52:33.000000Z