热点
"评估数据集" 相关文章
自动评估基准 | 一些评估测试集
Hugging Face 2025-01-10T09:00:55.000000Z
自动评估基准 | 一些评估测试集
智源社区 2025-01-09T05:07:26.000000Z
人工评估 | 技巧与提示
智源社区 2024-12-20T03:17:35.000000Z
Marqo Releases Advanced E-commerce Embedding Models and Comprehensive Evaluation Datasets to Revolutionize Product Search, Recommendation, and Benchmarking for Retail AI Applications
MarkTechPost@AI 2024-11-16T06:05:00.000000Z
无一大模型及格! 北大/通研院提出超难基准,专门评估长文本理解生成
智源社区 2024-08-08T14:37:18.000000Z