IT之家 2024年08月21日
微软发布 Phi-3.5 系列 AI 模型:上下文窗口 128K,首次引入混合专家模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

微软发布了Phi-3.5系列AI模型,包括Phi-3.5-MoE、Phi-3.5-vision和Phi-3.5-mini三款轻量级模型。其中,Phi-3.5-MoE是首个混合专家模型,在性能上超越了多个同类模型,并接近GPT-4o-mini。Phi-3.5-vision增强了多帧图像理解能力,并在相关基准测试中取得了提升。Phi-3.5-mini则是一款轻量级模型,在多语言任务中表现出色,并支持128K上下文窗口。

🚀 **Phi-3.5-MoE:首个混合专家模型** Phi-3.5-MoE是Phi系列中首个利用混合专家(MoE)技术的模型。该模型在16 x 3.8B MoE模型中使用2个专家,仅激活了66亿个参数,并在512个H100上使用4.9T标记进行了训练。微软研究团队从零开始设计该模型,以进一步提高其性能。在标准人工智能基准测试中,Phi-3.5-MoE的性能超过了Llama-3.1 8B、Gemma-2-9B和Gemini-1.5-Flash,并接近目前的领先者GPT-4o-mini。

📸 **Phi-3.5-vision:增强型多帧图像理解** Phi-3.5-vision拥有42亿个参数,使用256个A100 GPU在500B标记上进行训练,现在支持多帧图像理解和推理。Phi-3.5-vision在MMMU(从40.2提高到43.0)、MMBench(从80.5提高到81.9)和文档理解基准TextVQA(从70.9提高到72.0)上的性能均有提高。

🤏 **Phi-3.5-mini:轻量级、强功能** Phi-3.5-mini是一个38亿参数模型,超过了Llama3.1 8B和Mistral 7B,甚至可媲美Mistral NeMo 12B。该模型使用512个H100在3.4T标记上进行了训练。该模型仅有3.8B个有效参数,与拥有更多有效参数的LLMs相比,在多语言任务中具有很强的竞争力。此外,Phi-3.5-mini现在支持128K上下文窗口,而其主要竞争对手Gemma-2系列仅支持8K。

IT之家 8 月 21 日消息,微软公司今天发布了 Phi-3.5 系列 AI 模型,其中最值得关注的是推出了该系列首个混合专家模型(MoE)版本 Phi-3.5-MoE

本次发布的 Phi-3.5 系列包括 Phi-3.5-MoE、Phi-3.5-vision 和 Phi-3.5-mini 三款轻量级 AI 模型,基于合成数据和经过过滤的公开网站构建,上下文窗口为 128K,所有模型现在都可以在 Hugging Face 上以 MIT 许可的方式获取。IT之家附上相关介绍如下:

Phi-3.5-MoE:首个混合专家模型

Phi-3.5-MoE 是 Phi 系列中首个利用混合专家(MoE)技术的模型。该模型在 16 x 3.8B MoE 模型使用 2 个专家仅激活了 66 亿个参数,并使用 512 个 H100 在 4.9T 标记上进行了训练。

微软研究团队从零开始设计该模型,以进一步提高其性能。在标准人工智能基准测试中,Phi-3.5-MoE 的性能超过了 Llama-3.1 8B、Gemma-2-9B 和 Gemini-1.5-Flash,并接近目前的领先者 GPT-4o-mini。

Phi-3.5-vision:增强型多帧图像理解

Phi-3.5-vision 共有 42 亿个参数,使用 256 个 A100 GPU 在 500B 标记上进行训练,现在支持多帧图像理解和推理。

Phi-3.5-vision 在 MMMU(从 40.2 提高到 43.0)、MMBench(从 80.5 提高到 81.9)和文档理解基准 TextVQA(从 70.9 提高到 72.0)上的性能均有提高。

Phi-3.5-mini:轻量级、强功能

Phi-3.5-mini 是一个 38 亿参数模型,超过了 Llama3.1 8B 和 Mistral 7B,甚至可媲美 Mistral NeMo 12B。

该模型使用 512 个 H100 在 3.4T 标记上进行了训练。该模型仅有 3.8B 个有效参数,与拥有更多有效参数的 LLMs 相比,在多语言任务中具有很强的竞争力。

此外,Phi-3.5-mini 现在支持 128K 上下文窗口,而其主要竞争对手 Gemma-2 系列仅支持 8K。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

微软 Phi-3.5 AI模型 混合专家模型 图像理解
相关文章