我爱计算机视觉 2024年11月26日
图像超补全(Outpainting)技术的前沿模型与数据集资源汇总
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了图像外推(Image Outpainting)技术,该技术能够从给定的图像片段中补全缺失的外延部分,构建完整连贯的视觉世界。文章重点整理了Outpainting技术的前沿开源模型与算法资源,包括PQDiff、QueryOTR、U-Transformer、In&Out和Wide-Context Semantic Image Extrapolation等,这些模型在图像超补全方面取得了显著成果,并提供了相应的开源代码和数据集。此外,文章还介绍了这些模型的创新点和优势,例如连续倍数图像超补全、一步图像超补全、基于Transformer的框架以及全方位图像扩展等,旨在加速开发者在图像外推领域的研究和应用。

🖼️ **PQDiff方法**:创新性地实现了连续倍数的图像超补全,并通过一步操作完成图像超补全,显著提升了生成效率,在多个数据集上取得了SOTA性能。

🚀 **QueryOTR方法**:基于Vision Transformer,将Outpainting问题重新表述为序列到序列的自回归问题,并通过Query Expansion和Patch Smoothing模块解决模型收敛慢的问题,生成平滑逼真的图像。

🤖 **U-Transformer方法**:作为首个基于Transformer的图像超补全框架,能够全方位扩展图像内容,突破传统方法的局限,实现图像的无缝延伸和丰富,并创建了三个数据集用于训练和测试。

🔄 **In&Out方法**:通过逆转GAN的方式解决Outpainting问题,首先训练生成器合成micro-patches,然后通过逆映射过程恢复可用区域并预测补全区域。

🌐 **Wide-Context Semantic Image Extrapolation方法**:基于PyTorch的开源项目,旨在通过深度学习技术实现图像补全,能够扩展图像边界之外的语义敏感物体或场景。

算力君 2024-11-25 23:08 江苏

全部开源

“lmage outpainting”这一概念是由斯坦福大学 CS230 课程的 Mark Sabini 等人提出,相较于图像修复技术,lmage outpainting 更进一步,能够从给定的图像片段中“补全”出缺失的外延部分,以精妙的方式补全画面,从而构建出一个完整且连贯的视觉世界。

另外,所提出的论文Painting Outside the Box: Image Outpainting with GANs在吴恩达的斯坦福大学 CS230 课程中获得了期末 Poster 的第一名。

本文精心汇总了 Outpainting 技术的前沿开源模型与算法资源,旨在加速开发人员的研究进程,轻松获取所需算法与数据。

PQDiff

PQDiff 方法,用于图像超补全,具有以下创新点:

QueryOTR

基于 vision-transformer 的图像超补全方法,具有以下创新点:

U-Transformer

此工作是研究一种通用图像超补全问题,旨在全方位地扩展图像中的视觉内容,突破传统方法仅局限于水平方向扩展的局限,实现图像在全方位的无缝延伸与丰富,为图像处理领域带来前所未有的灵活性和广阔的应用前景。

具体创新如下:

In&Out

In&Out 是通过 inverting(逆转)GAN 的方式来解决 Outpainting 问题。首先训练一个生成器来合成以其位置为条件的 micro-patches 。在此基础上,提出一个 inversion(逆映射)过程,寻找多个 latent codes(隐藏码)恢复可用区域以及预测 outpainting(补全)区域。

Wide-Context Semantic Image Extrapolation

网络结构

Wide-Context Semantic Image Extrapolation 是一个基于 PyTorch 的开源项目,旨在通过深度学习技术实现图像的补全(outpainting),可以在图像边界之外扩展语义敏感的物体(如面部、身体)或场景。


✎往 期 推 荐

图像修复(Inpainting)技术的前沿模型与数据集资源汇总

趋动云是面向企业、科研机构和个人 AI 开发者构建的开发和推理训练服务,也是全球首个基于 GPU 算力池化云的服务。
趋动云的使命是连接算力 · 连接人:
?通过连接全球算力,趋动云可以为用户提供便宜、好用的 AI 算力。
?通过为AI算法开发全流程提供优化服务、构建全球开发者项目和数据社区,趋动云可以帮助AI开发者接入丰富的生态,快速实现最佳实践。


趋动云
连接算力・连接人


注册即领
10元
算力金
更多福利,扫码添加小助手 邀你入群~
做新手任务
再得180元算力金
请注册后联系小助手,获取新手任务

▼HOT 趋动云火热注册中!点击 “阅读原文” 即可尝鲜~

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

图像外推 Outpainting 图像超补全 GAN Transformer
相关文章