2024-07-22 21:02 湖北
Meta的Llama3 405B在发布前夕(之前预计是7.23号发布)被泄露出来,并且提供下载链接,大小约820G,此次要发布的405B模型被命名为Llama 3.1,版本号也再一次升级:
Llama 3.1 405B被泄露信息
关于即将官方正式发布的Llama 3.1 405B,有哪些需要关注的点尼:
它在基准测试中是否会比GPT-4o或Claude 3.5 Sonnet更好。
它将具备哪些多模态特性。
以及最重要的是,Meta会怎么说,他们是否已经达到了他们的扩展极限,或者我们还能期待什么。
Meta会怎么说关于自我学习(他们是否有类似于Q*的东西?)。
此前预告的Llama 3.1 405B性能
最近吵得火热的梗:“9.11与9.9谁更大”,Llama3.1-405B给出了自己的答案:
Llama 3.1 405B https://files.catbox.moe/d88djr.torrent
推荐阅读
• 对齐LLM偏好的直接偏好优化方法:DPO、IPO、KTO
• RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!
• Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图)
欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。