腾讯官方宣布,腾讯混元大模型首次登上海外权威大模型竞技场Chatbot Arena最新排名,成功跻身全球Top 15。该测评由LMSYS Org发起,以C端用户匿名投票的方式进行模型间的直接PK。今年以来,腾讯混元大模型迭代迅速,最新版混元Turbo S模型在中文基础能力方面表现出色,在《中文大模型测评基准SuperCLUE 3月报告》中位列基础模型国内第二,综合实力稳居国内大模型第一梯队。其应用能力排名国内第一,并在文本理解与创作、指令遵循以及Agent能力等多个维度刷新成绩。腾讯混元还预告了全新推理模型T1的发布。
🏅腾讯混元大模型在Chatbot Arena中取得佳绩,标志着其在全球范围内的竞争力得到认可。该竞技场采用用户匿名投票的方式,更贴近真实用户体验。
🚀最新版混元Turbo S模型在中文基础能力方面表现突出,在SuperCLUE 3月报告中位列国内第二,显示出其强大的中文处理能力。
💡腾讯混元在应用能力方面排名国内第一,尤其在文本理解与创作、指令遵循和Agent能力等维度表现出色,表明其在实际应用场景中具有显著优势。
📢腾讯混元预告将发布全新的推理模型T1,预示着其在技术上的持续创新和突破。
快科技3月10日消息,腾讯官方发文宣布,腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena最新排名,跻身全球 Top 15。
Chatbot Arena 发起方 LMSYS Org (加州大学伯克利分校等机构支持的非营利组织)通过官方X账号对腾讯混元的加入表示欢迎。

跟其他测评不一样,Chatbot Arena 的测评人是C端用户——用户在平台上以匿名方式与多个模型互动,然后投票决定哪个模型更好,从而根据分数生成排行榜。
这种测评也被看成是大模型直接PK的竞技场,简单直接。

官方还表示,今年以来,腾讯混元大模型快速迭代。
不久前推出最新版混元Turbo S模型,中文基础能力的表现同样抢眼,在《中文大模型测评基准SuperCLUE 3月报告》中,腾讯混元位列基础模型国内第二,综合实力稳居国内大模型第一梯队。

在模型象限中,腾讯混元应用能力排名国内第一,在文本理解与创作、指令遵循以及Agent能力等多个维度刷新最新成绩。
最后,腾讯混元还预告:全新的推理模型T1将在周五晚直播发布。
