
今年5月,智源研究院首次举办大模型评测发布会,正式推出科学、权威、公正、开放的智源评测体系,发布并解读国内外百余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。半年来,大模型的生态格局和能力象限有了变化和突破,智源也上线了面向多种模态的“大模型角斗场”和支持多种语言的“大模型辩论赛”评测平台,以甄别和度量模型能力差异。
2024年12月19日13:30-17:00,智源研究院将举办“智源评测秋冬发布会暨大模型辩论表演赛”,发布最新的国内外开闭源大模型的综合评测结果以及特色专项榜单,解读智源评测的方法与技术创新,欢迎报名线下参会或预约直播。
发布会时间&地点
时间:2024年12月19日(周四)13:30-17:00
地点:智源大厦一层报告厅(北京市海淀区成府路150号)
直播:视频号预约或点击阅读原文至智源社区观看
发布会亮点
顶尖专家云集:行业领袖和学术权威将汇聚于此,共同关注并探讨大模型评测相关形式与技术的发展,他们将分享在大模型评测领域的深刻见解和最新研究成果,为与会者提供宝贵的知识和启发。
大模型评测榜单发布:将重磅发布大模型评测榜单结果,这一发布将成为行业关注的焦点。大模型评测榜单是对当前大模型发展水平的一次全面梳理和集中展示,将客观地反映各个模型在不同维度的表现,为行业提供大模型能力展现最具价值的参考依据。
大模型评测的新应用:将深入探讨大模型评测在量化投资研究中的应用,展示其在金融领域的作用。这不仅体现了人工智能与其他行业的深度融合,还开拓了大模型应用评测的新场景,助力参会者洞悉跨行业应用潜力,推动人工智能在更多领域的创新实践。
创新评测方法展示:将展示大模型评测方法及解读,以及大模型评测新方法 - 模型对战等创新内容。这些具备创新性的前沿评测方法将为人工智能技术的评估和优化带来新的思路,参会者可以深入了解行业最先进的评测手段,拓宽技术视野,为自己的研究和实践提供启发。
Debate表演赛:本次表演赛是独具匠心的设计。在赛场上,大模型将围绕热门辩题展开唇枪舌战。这一设计旨在展现大模型的逻辑推理与语言表达能力,同时激发观众的思考,促进创新思维的交流与碰撞,成为推动评测创新的重要平台。
发布会议程

直播预约
1. 视频号
2. 关于智源评测首次发布会直播回放请点击请点击阅读原文至智源社区观看。
内容中包含的图片若涉及版权问题,请及时与我们联系删除