PaperAgent 04月09日 18:32
智源bge开源一系列多模态向量模型,冲~
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

智源研究院开源了多模态检索模型BGE-VL系列,包括BGE-VL-CLIP(base版和large版)和BGE-VL-MLLM。这些模型可用于图文检索,支持RAG和Agentic应用。BGE-VL基于MegaPairs数据集训练,该数据集通过开放领域的图像合成异构KNN三元组,包含超过2600万个三元组。BGE-VL在零样本组合图像检索任务中表现出色,BGE-VL-MLLM在MMEB上实现了最先进的零样本性能,展示了MegaPairs在多模态嵌入方面的强大泛化能力。

🖼️ BGE-VL模型系列:智源研究院发布了BGE-VL系列多模态检索模型,包含BGE-VL-CLIP(base版和large版)以及BGE-VL-MLLM,这些模型能够进行图文检索,适用于RAG和Agentic应用场景。

💡 MegaPairs数据集:BGE-VL模型基于MegaPairs数据集训练,该数据集采用新颖的数据合成方法,利用开放领域的图像创建异构KNN三元组,总共包含超过2600万个三元组,为模型的训练提供了坚实的基础。

🥇 卓越的零样本性能:BGE-VL在零样本组合图像检索任务中表现出色,BGE-VL-base模型在CIRCO基准测试中超越了所有之前的模型。BGE-VL-MLLM在大规模多模态嵌入基准测试(MMEB)上实现了最先进的零样本性能,展现了MegaPairs在多模态嵌入方面的强大泛化能力。

2025-03-31 22:22 湖北

智源研究院BAAI开源一系列多模态检索模型BGE-VL,包括BGE-VL-CLIP(base版和large版)和BGE-VL-MLLM。
可很方便使用BGE-VL-CLIP模型,支持图文检索召回图文,可用于RAG、Agentic应用场景。
    import torchfrom transformers import AutoModelMODEL_NAME = "BAAI/BGE-VL-base" # or "BAAI/BGE-VL-large"model = AutoModel.from_pretrained(MODEL_NAME, trust_remote_code=True# You must set trust_remote_code=Truemodel.set_processor(MODEL_NAME)model.eval()with torch.no_grad():    query = model.encode(        images = "./assets/cir_query.png"        text = "Make the background dark, as if the camera has taken the photo at night"    )    candidates = model.encode(        images = ["./assets/cir_candi_1.png""./assets/cir_candi_2.png"]    )        scores = query @ candidates.Tprint(scores)
    BGE-VL在MegaPairs上训练而成,这是一种新颖的数据合成方法,利用开放领域的图像创建异构KNN三元组,用于通用多模态检索,包含超过2600万个三元组。
    更多信息:《动手设计AI Agents:CrewAI版》、《高级RAG之36技》、新技术实战:中文Lazy-GraphRAG/Manus+MCP/GRPO+Agent、大模型日报/月报、最新技术热点追踪解读(GPT4-o/数字人/MCP/Gemini 2.5 Pro)
      https://github.com/VectorSpaceLab/MegaPairshttps://hf-mirror.com/BAAI/BGE-VL-MLLM-S2https://arxiv.org/pdf/2412.14475

      推荐阅读


        欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

        阅读原文

        跳转微信打开

        Fish AI Reader

        Fish AI Reader

        AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

        FishAI

        FishAI

        鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

        联系邮箱 441953276@qq.com

        相关标签

        BGE-VL 多模态检索 MegaPairs
        相关文章