2024-07-25 15:58 湖北
关键信息:
数学模型如NuminaMath和Mathstral。
NuminaMath获得AIMO一等进步奖,模型与数据都开源
小型模型在手机上的性能越来越好。
Agents和Function Calling在大型语言模型(LLM)中越来越流行。
多模态模型,特别是在图像+文本领域和音频领域,CogVLM2、InternVL 2.0
无需OCR或分割即可获得文档良好嵌入的视觉嵌入模型。
文本到图像的技术有新的玩家加入,如Anole、Fal和腾讯。
开源大模型越来越强,Meta的Llama 3.1 405B,以及Mistral Large 2(代码生成、数学和推理方面表现出色,与 GPT-4o、Claude 3 Opus 和 Llama 3 405B 等相当)
报告PPT详情:
推荐阅读
• 对齐LLM偏好的直接偏好优化方法:DPO、IPO、KTO
• RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!
• Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图)
欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。