热点
"GSM8K" 相关文章
AI 推理能力大“翻车”!苹果最新论文:LLM只是复杂的模式匹配,而不是真正的逻辑推理
华尔街见闻 2024-10-13T03:19:27.000000Z
Key Metrics for Evaluating Large Language Models (LLMs)
MarkTechPost@AI 2024-06-20T03:01:46.000000Z