热点
关于我们
xx
xx
"
PHYX
" 相关文章
Multimodal Foundation Models Fall Short on Physical Reasoning: PHYX Benchmark Highlights Key Limitations in Visual and Symbolic Integration
MarkTechPost@AI
2025-05-31T02:45:51.000000Z
多模态模型具备“物理推理能力”了吗?新基准揭示:表现最好的GPT-o4 mini也远不及人类!
智源社区
2025-05-28T13:34:41.000000Z
全球顶尖 AI 做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压
掘金 人工智能
2025-05-28T06:58:02.000000Z
全球顶尖AI做物理 被人类按地摩擦?
Cnbeta
2025-05-28T02:02:31.000000Z