热点
"偏好对齐" 相关文章
扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升
机器之心 2025-06-07T07:11:41.000000Z
ICML 2025 | RLHF太贵太慢?TPO即时对齐新方案,一句话指令搞定偏好优化
PaperWeekly 2025-05-21T06:12:30.000000Z
把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源
机器之心 2024-12-27T08:09:02.000000Z
Meet GRAPE: A Plug-and-Play Algorithm to Generalize Robot Policies via Preference Alignment
MarkTechPost@AI 2024-12-08T07:49:27.000000Z
多图场景用DPO对齐!上海AI实验室等提出新方法,无需人工标注
智源社区 2024-11-02T10:53:35.000000Z
多图场景用DPO对齐,上海AI实验室等提出新方法,无需人工标注
36kr 2024-11-01T12:03:56.000000Z