GSM8K_Fishai

热点

"GSM8K" 相关文章

AbstRaL: Teaching LLMs Abstract Reasoning via Reinforcement to Boost Robustness on GSM Benchmarks

MarkTechPost@AI 2025-07-06T00:58:16.000000Z

AI 推理能力大“翻车”！苹果最新论文：LLM只是复杂的模式匹配，而不是真正的逻辑推理

华尔街见闻 2024-10-13T03:19:27.000000Z

Key Metrics for Evaluating Large Language Models (LLMs)

MarkTechPost@AI 2024-06-20T03:01:46.000000Z

Copyright © 2019 FISHAI.All Rights Reserved