热点
"PRIME" 相关文章
华硕两款 RTX 5060 Ti 显卡 SKU 曝光,提供 16GB 和 8GB 版本
IT之家 2025-04-08T09:42:56.000000Z
华硕披露 AMD Radeon RX 9070 XT / 9070 显卡部分规格:配 16GB 显存、需搭 750W 电源
IT之家 2025-01-10T07:07:26.000000Z
1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA
硅星人Pro 2025-01-09T16:42:53.000000Z
1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA
智源社区 2025-01-08T07:07:15.000000Z
社区供稿 | 无需模仿,超越蒸馏!清华团队靠强化学习让 7B 模型打败 GPT-4o 数学推理
智源社区 2025-01-08T04:22:08.000000Z
社区供稿 | 无需模仿,超越蒸馏!清华团队靠强化学习让 7B 模型打败 GPT-4o 数学推理
Hugging Face 2025-01-07T16:15:46.000000Z
仅需一万块钱!清华团队靠强化学习让 7B模型数学打败GPT-4o
量子位 2025-01-06T07:54:25.000000Z
PRIME: An Open-Source Solution for Online Reinforcement Learning with Process Rewards to Advance Reasoning Abilities of Language Models Beyond Imitation or Distillation
MarkTechPost@AI 2025-01-05T02:45:09.000000Z
登Science子刊!上海交大联合上海AI Lab等发布蛋白质突变体设计模型,优于最先进方法
智源社区 2024-12-09T10:46:13.000000Z
全球首个去中心化训练的10B级模型已正式开源,使用横跨三大洲的112块GPU训练而成
MIT 科技评论 - 本周热榜 2024-12-06T03:26:23.000000Z
Black D.C. neighborhoods denied same-day deliveries by Amazon, attorney general claims
Mashable 2024-12-04T20:56:29.000000Z
美欧亚三洲开发者联手,全球首个组团训练的大模型来了,全流程开源
36氪 AI 2024-12-02T09:30:44.000000Z