DeepSeek-R1联网搜索能力首测：腾讯元宝第一

最新-新浪科技科学探索 03月11日 19:07

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

SuperCLUE发布DeepSeek-R1联网搜索能力首测，对接入该模型的第三方平台进行测评。腾讯元宝以80.61分领跑，在总分、基础检索能力和分析推理能力三个关键指标上均位列第一。阶跃AI和支付宝百宝箱分列二、三位。测评显示各平台在基础检索能力上表现优秀，但在分析推理能力上存在较大差距，表明在高级认知任务方面仍有进步空间。飞书知识问答、阶跃AI、腾讯元宝和支付宝百宝箱在联网搜索回复率方面表现优秀，完整回复率均为100%。各平台耗时差异显著，字节火山引擎耗时最短，MiniMax耗时最长。

🥇腾讯元宝在SuperCLUE的DeepSeek-R1联网搜索能力首测中表现突出，以80.61的总分位居榜首，并在基础检索能力和分析推理能力两项关键指标上均排名第一，显示其在信息获取和深度理解方面的综合实力。

🔍各平台在基础检索能力方面表现普遍较好，平均得分高达95.45，体现了快速准确获取信息的能力。但分析推理能力平均得分仅为35.35，与基础检索能力差距显著，表明在理解、分析和解决复杂问题方面仍有待提升。

⏱️不同平台在联网搜索的耗时方面存在显著差异，从字节火山引擎的17.12秒/题到MiniMax的73.51秒/题，反映出各平台在搜索效率上的巨大差距。同时，所有平台在分析推理任务上的平均耗时均高于基础检索任务，也侧面印证了分析推理能力的瓶颈。

快科技3月11日消息，国产大模型DeepSeek-R1爆火后，许多第三方平台陆续接入了该模型，比如腾讯、阶跃星辰、蚂蚁集团、百度、字节跳动等等。

今日，中文大模型测评基准SuperCLUE发布DeepSeek-R1联网搜索能力首测，公布了10家第三方平台测评结果。

从结果来看，腾讯元宝是本次测评中唯一一个超过80分的第三方平台，以80.61分领跑联网搜索测评榜单，腾讯元宝在总分、基础检索能力和分析推理能力三个关键指标上均位列第一。

阶跃AI以74.49分的总分位居第二，支付宝百宝箱以73.47分位居第三，而其他平台在本次测评中则处于不同的梯队，性能存在一定的差异。