热点
关于我们
xx
xx
"
AI行为
" 相关文章
AI会谄媚用户的原因,竟然是不够“普信”
36kr
2025-07-28T01:06:08.000000Z
年薪两百万研究“AI 精神病学”,Claude 团队新部门火热招聘中
IT之家
2025-07-24T10:14:10.000000Z
DeepMind证实:反对意见让GPT-4o轻易放弃正确答案
cnBeta全文版
2025-07-20T11:34:31.000000Z
当Claude说:我先睡8小时,你们自己忙
机器之心
2025-07-20T08:15:23.000000Z
New Grok AI model surprises experts by checking Elon Musk’s views before answering
Ars Technica - All content
2025-07-14T16:31:56.000000Z
GPT-4o Responds to Negative Feedback
少点错误
2025-04-30T20:22:29.000000Z
AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断
新智元
2025-04-09T11:22:29.000000Z
AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断
智源社区
2025-04-07T16:42:05.000000Z
AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断
36kr-科技
2025-04-07T01:37:12.000000Z
Notes on handling non-concentrated failures with AI control: high level methods and different regimes
少点错误
2025-03-24T01:11:08.000000Z
Anthropic: ↩️ We designed a curriculum of increasingly complex environments with misspecified reward functions. Early on, AIs discover dishonest str...
AnthropicAI推特
2024-06-18T06:33:36.000000Z