HuggingFace 每日AI论文速递 2024年12月05日
2024.11.22 每日AI论文 | 混合偏好优化提升推理,多模态自回归预训练创新。
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期介绍了14篇论文,涵盖多模态语言模型、视觉推理、语言模型知识意识、图像编辑等多个领域的研究成果。

🧠通过混合偏好优化提升多模态大语言模型推理能力

🌐大规模视觉编码器多模态自回归预训练

🚀超稀疏内存网络等多种研究成果被提及

本期的 14 篇论文如下:

[00:26] ? Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization(通过混合偏好优化提升多模态大语言模型的推理能力)

[01:12] ? Multimodal Autoregressive Pre-training of Large Vision Encoders(大规模视觉编码器多模态自回归预训练)

[01:55] ? Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions(Marco-o1:面向开放式解决方案的开放推理模型)

[02:40] ? Hymba: A Hybrid-head Architecture for Small Language Models(Hymba:一种用于小语言模型的混合头架构)

[03:22] ? Ultra-Sparse Memory Network(超稀疏内存网络)

[03:58] ? OpenScholar: Synthesizing Scientific Literature with Retrieval-augmented LMs(开放学者:利用检索增强型语言模型合成科学文献)

[04:47] ? Natural Language Reinforcement Learning(自然语言强化学习)

[05:26] ? Insight-V: Exploring Long-Chain Visual Reasoning with Multimodal Large Language Models(Insight-V:探索多模态大语言模型的长链视觉推理)

[06:08] ? Do I Know This Entity? Knowledge Awareness and Hallucinations in Language Models(我了解这个实体吗?语言模型中的知识意识与幻觉)

[06:46] ? Stable Flow: Vital Layers for Training-Free Image Editing(稳定流:无需训练的图像编辑关键层)

[07:25] ? UnifiedCrawl: Aggregated Common Crawl for Affordable Adaptation of LLMs on Low-Resource Languages(统一爬取:利用Common Crawl为低资源语言的LLM提供经济适用的适应性)

[08:03] ? MagicDriveDiT: High-Resolution Long Video Generation for Autonomous Driving with Adaptive Control(MagicDriveDiT:基于自适应控制的高分辨率长视频生成用于自动驾驶)

[08:44] ? Patience Is The Key to Large Language Model Reasoning(耐心是大型语言模型推理的关键)

[09:18] ? Baking Gaussian Splatting into Diffusion Denoiser for Fast and Scalable Single-stage Image-to-3D Generation(将高斯散射融入扩散去噪器以实现快速且可扩展的单阶段图像到3D生成)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

多模态语言模型 视觉推理 图像编辑
相关文章