腾讯混元首次上榜Chatbot Arena排名：跻身全球Top 15

快科技资讯 03月20日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

腾讯官方宣布，腾讯混元大模型首次登上海外权威大模型竞技场Chatbot Arena最新排名，成功跻身全球Top 15。该测评由LMSYS Org发起，以C端用户匿名投票的方式进行模型间的直接PK。今年以来，腾讯混元大模型迭代迅速，最新版混元Turbo S模型在中文基础能力方面表现出色，在《中文大模型测评基准SuperCLUE 3月报告》中位列基础模型国内第二，综合实力稳居国内大模型第一梯队。其应用能力排名国内第一，并在文本理解与创作、指令遵循以及Agent能力等多个维度刷新成绩。腾讯混元还预告了全新推理模型T1的发布。

🏅腾讯混元大模型在Chatbot Arena中取得佳绩，标志着其在全球范围内的竞争力得到认可。该竞技场采用用户匿名投票的方式，更贴近真实用户体验。

🚀最新版混元Turbo S模型在中文基础能力方面表现突出，在SuperCLUE 3月报告中位列国内第二，显示出其强大的中文处理能力。

💡腾讯混元在应用能力方面排名国内第一，尤其在文本理解与创作、指令遵循和Agent能力等维度表现出色，表明其在实际应用场景中具有显著优势。

📢腾讯混元预告将发布全新的推理模型T1，预示着其在技术上的持续创新和突破。

快科技3月10日消息，腾讯官方发文宣布，腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena最新排名，跻身全球 Top 15。

Chatbot Arena 发起方 LMSYS Org （加州大学伯克利分校等机构支持的非营利组织）通过官方X账号对腾讯混元的加入表示欢迎。

跟其他测评不一样，Chatbot Arena 的测评人是C端用户——用户在平台上以匿名方式与多个模型互动，然后投票决定哪个模型更好，从而根据分数生成排行榜。

这种测评也被看成是大模型直接PK的竞技场，简单直接。

官方还表示，今年以来，腾讯混元大模型快速迭代。

不久前推出最新版混元Turbo S模型，中文基础能力的表现同样抢眼，在《中文大模型测评基准SuperCLUE 3月报告》中，腾讯混元位列基础模型国内第二，综合实力稳居国内大模型第一梯队。

在模型象限中，腾讯混元应用能力排名国内第一，在文本理解与创作、指令遵循以及Agent能力等多个维度刷新最新成绩。

最后，腾讯混元还预告：全新的推理模型T1将在周五晚直播发布。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签