2024.12.30 每日AI论文 | 华佗GPT-o1提升医学推理，Orient Anything精准估计物体方向。

HuggingFace 每日AI论文速递 2024年12月31日

2024.12.30 每日AI论文 | 华佗GPT-o1提升医学推理，Orient Anything精准估计物体方向。

本期介绍了 8 篇论文，涉及医学、物体方向估计、多模态模型优化、扩散模型、图形设计、语言模型保护、图表问答及视频生成等领域。

🧠华佗GPT-o1用于医学复杂推理的大语言模型

🧭从渲染3D模型学习物体方向估计的方法

🔍通过视觉任务对齐提升多模态大语言模型

🧬使用Itô密度估计器进行扩散模型的叠加

🎨分层的自动图形设计构图的新途径

🛡保护微调大型语言模型的模型合并方式

📊从合成图像预训练图表问答的研究

🎥利用视频扩散模型实现零样本定制视频生成

本期的 8 篇论文如下：

[00:30] ? HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs（华佗GPT-o1：迈向医学复杂推理的大语言模型）

[01:16] ? Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models（定向万物：从渲染3D模型中学习鲁棒的物体方向估计）

[02:03] ? Task Preference Optimization: Improving Multimodal Large Language Models with Vision Task Alignment（任务偏好优化：通过视觉任务对齐提升多模态大语言模型）

[02:50] ? The Superposition of Diffusion Models Using the Itô Density Estimator（使用Itô密度估计器进行扩散模型的叠加）

[03:33] ? From Elements to Design: A Layered Approach for Automatic Graphic Design Composition（从元素到设计：一种分层的自动图形设计构图方法）

[04:16] ? Safeguard Fine-Tuned LLMs Through Pre- and Post-Tuning Model Merging（通过预调优和后调优模型合并保护微调的大型语言模型）

[04:56] ? SBS Figures: Pre-training Figure QA from Stage-by-Stage Synthesized Images（SBS图表：从分阶段合成图像预训练图表问答）

[05:47] ? VideoMaker: Zero-shot Customized Video Generation with the Inherent Force of Video Diffusion Models（VideoMaker：利用视频扩散模型的内在力量实现零样本定制视频生成）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

论文多领域研究成果

相关文章

谷歌的新项目，这下可以在上下班听论文了，如果有中文就好了。可以将论文转换为通俗易懂的对话音频，帮助你更好的理解和学习论文内容。这里试用，大部分都是AI...

每日简报：如果你做了研究却不发表，这还算科学吗？

Ask HN: Calico（谷歌生命科学）有结果了吗？

万能的jrs，硕士学位证缓授，入职要提交双证，救救小弟

姜萍到底得罪了谁的利益？

NASA: ↩️ @juliaruiz35 Click the YouTube link at the end of the post! https://youtu.be/4TXDedBlyBI

顺着姜萍的主＝6的思路完整把题写了一遍

现在的大学生这么厉害了吗？本科发sci？

社区v_3.6.6版本更新：个人页关联数据与升级