HuggingFace 每日AI论文速递 2024年12月31日
2024.12.30 每日AI论文 | 华佗GPT-o1提升医学推理,Orient Anything精准估计物体方向。
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本期介绍了 8 篇论文,涉及医学、物体方向估计、多模态模型优化、扩散模型、图形设计、语言模型保护、图表问答及视频生成等领域。

🧠华佗GPT-o1用于医学复杂推理的大语言模型

🧭从渲染3D模型学习物体方向估计的方法

🔍通过视觉任务对齐提升多模态大语言模型

🧬使用Itô密度估计器进行扩散模型的叠加

🎨分层的自动图形设计构图的新途径

🛡保护微调大型语言模型的模型合并方式

📊从合成图像预训练图表问答的研究

🎥利用视频扩散模型实现零样本定制视频生成

本期的 8 篇论文如下:

[00:30] ? HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs(华佗GPT-o1:迈向医学复杂推理的大语言模型)

[01:16] ? Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models(定向万物:从渲染3D模型中学习鲁棒的物体方向估计)

[02:03] ? Task Preference Optimization: Improving Multimodal Large Language Models with Vision Task Alignment(任务偏好优化:通过视觉任务对齐提升多模态大语言模型)

[02:50] ? The Superposition of Diffusion Models Using the Itô Density Estimator(使用Itô密度估计器进行扩散模型的叠加)

[03:33] ? From Elements to Design: A Layered Approach for Automatic Graphic Design Composition(从元素到设计:一种分层的自动图形设计构图方法)

[04:16] ? Safeguard Fine-Tuned LLMs Through Pre- and Post-Tuning Model Merging(通过预调优和后调优模型合并保护微调的大型语言模型)

[04:56] ? SBS Figures: Pre-training Figure QA from Stage-by-Stage Synthesized Images(SBS图表:从分阶段合成图像预训练图表问答)

[05:47] ? VideoMaker: Zero-shot Customized Video Generation with the Inherent Force of Video Diffusion Models(VideoMaker:利用视频扩散模型的内在力量实现零样本定制视频生成)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

论文 多领域 研究成果
相关文章