刚刚，OpenAI神秘开源模型泄露！「闪现」1分钟被删，配置被网友扒光

智源社区 11小时前

刚刚，OpenAI神秘开源模型泄露！「闪现」1分钟被删，配置被网友扒光

近日，OpenAI的开源模型GPT-OSS-20B和GPT-OSS-120B疑似在Hugging Face上被短暂泄露。网友迅速捕捉到了这一信息，并保存了模型的详细配置。该模型采用MoE（Mixture of Experts）架构，拥有36层Transformer，大规模MoE设置，词表超过20万，上下文窗口4096，并使用Multi-QueryAttention。一位OpenAI成员点赞了相关爆料推文，增加了泄露的真实性。此次事件引发了关于GPT-5发布前预热的猜测，也让大家对OpenAI的开源策略和模型能力充满期待。

🕵️‍♂️ **疑似OpenAI开源模型泄露**：名为GPT-OSS-20B和GPT-OSS-120B的模型文件出现在Hugging Face平台，尽管随后被删除，但有网友在极短时间内成功保存了配置信息，揭示了OpenAI可能即将开源的模型参数。

🧠 **MoE混合专家架构**：泄露的参数显示该模型基于MoE架构，包含36层Transformer，每层可能采用MoE路由。其大规模MoE设置拥有128个专家，每个token激活4个，预示着模型在处理复杂任务时可能具备更强的灵活性和效率。

📚 **强大的语言处理能力**：模型词表量超过20万，暗示可能支持多语种或代码的混合输入。同时，4096的上下文窗口结合滑动窗口和扩展RoPE技术，表明其可能具备处理更长文本的能力，并通过NTK插值版本RoPE来扩展上下文。

💡 **先进的注意力机制**：模型配备了64个注意力头，但键/值头只有8个，这表明其采用了Multi-QueryAttention（MQA）机制，这种机制有助于提高推理效率，尤其是在大型模型中。

刚刚，OpenAI开源模型疑似被手滑「泄露」？！\x0a\x0agpt-oss-20b 和 gpt-oss-120b！\x0a\x0a网友@apples_jimmy在这组模型上传Hugging Face后一分钟内就发现了。\x0a\x0a99%的概率这就是OpenAI的开源模型——\x0a\x0agpt属于OpenAI，oss代表开源软件，20b和120b代表了两个参数版本。\x0a\x0a幸运的是，在它被删除之前，Jimmy Apples保存了配置，在只有不到「1分钟」的时间窗口！\x0a\x0a他分享了一段LLM的配置文件，极有可能是OpenAI即将开源模型的详细参数。\x0a\x0a这组参数像是一个基于MoE（Mixture of Experts）混合专家架构的高容量模型，具备以下几个特点：\x0a\x0a· 36层Transformer，每层可能有MoE路由；\x0a· 大规模MoE设置（128个专家，每个token激活4个）；\x0a· 词表超过20万，可能支持多语种或代码混合输入；\x0a· 上下文窗口为4096，但也有滑动窗口和扩展RoPE，表明模型可能具备处理更长上下文的能力；\x0a· 使用RoPE的NTK插值版本，这是许多模型扩展上下文的一种方式（如GPT-4 Turbo使用的方式）；\x0a· 注意力头多达64个，但键/值头只有8个，意味着模型用的是是Multi-QueryAttention（MQA）。\x0a\x0a另一位网友@secemp9似乎验证了这次「泄露」的真实性。\x0a\x0a他不仅也在Hugging Face上发现这个模型，甚至还有一位OpenAI成员点赞了他的爆料推文。\x0a\x0a上传这个模型的组织叫做「yofo-happy-panda」，共有三名成员。\x0a\x0a其中，Dominik Kundel正是OpenAI的现任员工，目前负责开发者体验和SDK。\x0a\x0a有网友猜测，所谓的提前泄露，或许是GPT-5发布前的预热？\x0a\x0a如果真是这样的参数配置，你满意吗？

内容中包含的图片若涉及版权问题，请及时与我们联系删除

点赞收藏评论分享到Link

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI 开源模型 GPT-OSS Hugging Face MoE

相关文章

OpenAI加入C2PA指導委員會，測試Deepfake圖像偵測工具

How popular is ChatGPT? Part 1: more popular than Taylor Swift

OpenAI set to unveil AI-driven challenger to Google Search

OpenAI faces complaint over fictional outputs

OpenAI计划下周宣布ChatGPT和GPT-4更新，但不会推出GPT-5和搜索引擎

苹果据悉接近与OpenAI达成协议，将ChatGPT应用于iPhone

OpenAI据悉正开发AI语音助手

Comment on What should the UK’s £100 million Foundation Model Taskforce do? by Government-issued digital money gets closer - The World News Papers

Comment on What should the UK’s £100 million Foundation Model Taskforce do? by Il denaro digitale emesso dal governo si sta avvicinando - Darios Cafe Blogs

Open Source Generative AI at Hugging Face with Jeff Boudier - #624