快科技资讯 06月06日 11:36
实力就是这么硬!阿里开源千问3向量模型:性能狂增40%干翻谷歌、OpenAI
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里巴巴正式开源了通义千问3的向量模型系列Qwen3-Embedding,该模型基于千问3底座,专注于文本表征、检索和排序等任务。相较于前代产品,Qwen3-Embedding在多项核心任务上实现了高达40%的性能提升,并在MTEB等专项榜单中超越了谷歌、OpenAI和微软的顶尖模型,成为同类最佳。新模型支持超过100种语言及多种编程语言,具备强大的多语言、跨语言及代码检索能力。此次开源包含9款不同尺寸的模型,开发者可根据需求自由选择和定制,目前已在多个平台开源,方便开发者使用。

🔍 Qwen3-Embedding是基于通义千问3大模型构建的向量模型系列,专门针对文本表征、检索和排序等核心任务进行优化。

📈 与上一代模型相比,Qwen3-Embedding在文本检索、聚类、分类等核心任务上实现了最高40%以上的性能提升,并在MTEB等榜单中表现出色。

🌐 该模型系列支持超过100种语言,并涵盖多种编程语言,具备强大的多语言、跨语言及代码检索能力,方便全球开发者使用。

🛠️ 此次开源包含9款不同尺寸的模型,如0.6B、4B、8B等,并提供GGUF版本,开发者可以根据自身需求自由选择和组合。

🚀 Qwen3-Embedding和Reranker模型已在魔搭社区、Hugging Face和GitHub等平台上开源,开发者也可通过阿里云百炼使用API服务。

快科技6月6日消息,阿里正式开源了通义千问3全新的向量模型系列Qwen3-Embedding(简称千问3向量模型)。

该模型以千问3为底座,专门为文本表征、检索和排序等核心任务进行优化训练,相较于上一个版本,在文本检索、聚类、分类等核心任务上提升最高40%以上的性能。

在MTEB等专项榜单中,Qwen3-Embedding-8B超越谷歌的Gemini Embedding 、Open AI的 text-embedding-3-large及微软的multilingual-e5-large-instruct等顶尖模型,拿下同类模型的最佳性能SOTA。

向量模型可以看做是AI的“翻译器”,它可以将文本、图片等非结构化信息,映射(embedding)到机器更易理解的向量空间,再基于这些向量实现高效的信息分类、检索或排序。

基于千问3模型,通义团队通过对比训练、SFT、模型融合等方法,打造出全新的千问3向量模型,包含文本嵌入模型Qwen3-Embedding 以及文本排序模型Qwen3-Reranker。

同时,得益于千问3的多语言能力,千问3向量模型系列率先支持超100种语言,并涵盖多种编程语言,可实现强大的多语言、跨语言及代码检索能力。

此次共有9款千问3向量模型开源,涵盖0.6B、4B 、8B等不同尺寸及GGUF版本,开发者可从中找到最符合需求的模型,自由组合模块,还可自定义向量或指令,实现特定任务、语言和场景的深度优化。

目前,千问3 Embedding和Reranker模型均已在魔搭社区、 Hugging Face和GitHub等平台上开源,开发者也可直接通过阿里云百炼使用API服务。

据了解,千问3大模型自4月29日开源以来,已揽获Artificial Analysis、LiveBench、LiveCodeBench、SuperClue多个榜单的全球开源冠军。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

通义千问3 向量模型 Qwen3-Embedding 开源
相关文章