智源社区 01月23日
BrushEdit:一体化图像修复和编辑(All-In-One Image Inpainting and Editing)
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

BrushEdit是一个先进的AI代理,用于图像修复和编辑。它采用基于修复的指令引导编辑范式,结合多模态大型语言模型(MLLM)和图像修复模型,实现自主、用户友好和交互式的自由形式指令编辑。该系统通过代理协作框架,执行编辑类别分类、主要对象识别、蒙版获取和编辑区域修复。BrushEdit有效地结合了MLLM和修复模型,并在蒙版区域保存和编辑效果一致性等多个指标上表现出色。其核心流程包括:编辑类型分类、识别编辑对象、获取编辑蒙版和目标标题、以及使用双分支修复模型BrushNet进行图像修复。

🧰 BrushEdit采用基于修复的指令引导编辑范式,通过集成多模态大型语言模型(MLLM)和图像修复模型,实现自主、用户友好和交互式的自由形式指令编辑,克服了传统方法在重大修改和用户交互上的局限性。

🎯 该系统通过代理协作框架,执行编辑类别分类、主要对象识别、蒙版获取和编辑区域修复等关键步骤,确保编辑过程的精确性和高效性。其中,MLLM和检测模型用于确定编辑类型、目标对象、编辑蒙版和目标标题。

🖼️ BrushEdit使用改进的双分支修复模型BrushNet进行图像编辑。该模型能够根据目标标题和编辑蒙版修复目标区域,有效利用修复模型的生成潜力和背景保存能力,从而实现高质量的图像编辑效果。

Yaowei Li1*, Yuxuan Bian3*, Xuan Ju3*, Zhaoyang Zhang2‡, Junhao Zhuang4, Ying Shan2✉,  Yuexian Zou1✉ Qiang Xu3✉

1Peking University 2ARC Lab, Tencent PCG
3The Chinese University of Hong Kong
4Tsinghua University
✉ Corresponding Author ‡ Project Lead

https://liyaowei-stu.github.io/project/BrushEdit/

BrushEdit 是一个先进的、统一的 AI 代理,用于图像修复和编辑。

主要元素:?️全自动 / ? 交互式编辑。

摘要

随着基于反转和基于指令的方法的发展,图像编辑取得了长足的进步。然而,由于反转噪声的结构化性质,当前基于反转的方法难以进行重大修改(例如,添加或删除对象),从而阻碍了实质性的变化。同时,基于指令的方法通常将用户限制在黑箱操作中,限制了指定编辑区域和强度的直接交互。为了解决这些限制,我们提出了BrushEdit,一种新颖的基于修复的指令引导图像编辑范式,它利用多模态大型语言模型 (MLLM) 和图像修复模型来实现自主、用户友好和交互式的自由形式指令编辑。具体而言,我们设计了一个支持自由形式指令编辑的系统,通过在代理协作框架中集成MLLM和双分支图像修复模型来执行编辑类别分类、主要对象识别、蒙版获取和编辑区域修复。大量实验表明,我们的框架有效地结合了 MLLM 和修复模型,在七个关键指标上取得了优异的性能,包括蒙版区域保存和编辑效果一致性。

我们的方法包括四个主要步骤:(i)编辑类别分类:确定所需的编辑类型。(ii)识别主要编辑对象:识别要编辑的主要对象。(iii)获取编辑蒙版和目标标题:生成编辑蒙版和相应的目标标题。(iv)图像修复:执行实际的图像编辑。步骤(i)至(iii)利用预先训练的 MLLM检测模型来确定编辑类型、目标对象、编辑蒙版和目标标题。步骤(iv)涉及使用改进的双分支修复模型BrushNet进行图像编辑。该模型根据目标标题和编辑蒙版修复目标区域,利用修复模型的生成潜力和背景保存能力。

@misc{li2024brushedit, title={BrushEdit: All-In-One Image Inpainting and Editing}, author={Yaowei Li and Yuxuan Bian and Xuan Ju and Zhaoyang Zhang and and Junhao Zhuang and Ying Shan and Yuexian Zou and Qiang Xu}, year={2024}, eprint={2412.10316}, archivePrefix={arXiv}, primaryClass={cs.CV}

}

内容中包含的图片若涉及版权问题,请及时与我们联系删除

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

BrushEdit 图像修复 AI编辑 多模态模型 深度学习
相关文章