我爱计算机视觉 02月28日
ICLR 2025 | 小红书等给AI图像检测上难度!数据集均通过人类感知“图灵测试”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

小红书团队联合中科大、上海交大提出了一种新的AI生成图像检测方法AIDE,并构建了高难度Chameleon基准数据集。AIDE模型通过融合低级像素统计和高级语义特征,显著提升了AI生成图像的检测准确率,超越了现有方法。Chameleon数据集因其图像的高度逼真性,对现有检测模型构成极大挑战,揭示了AI图像检测领域仍有巨大进步空间。这项研究为未来的AI图像检测技术发展提供了新的方向和思路。

🖼️Chameleon基准数据集的提出:该数据集以其高度逼真性著称,所有AI生成图像均通过了人类感知“图灵测试”,即人类标注者无法将其与真实图像区分开来,对现有检测模型提出了前所未有的挑战。

🔍AIDE模型的核心设计:AIDE模型通过融合Patchwise Feature Extraction (PFE) 和 Semantic Feature Embedding (SFE) 两个模块,分别捕捉图像的低级像素统计特征(如噪声模式和纹理异常)和高级语义特征(如物体共现和上下文关系),实现了对AI生成图像的精准检测。

📈实验结果的显著提升:实验结果表明,AIDE模型在AIGCDetectBenchmark和GenImage两个数据集上,分别比现有的最先进方法提高了3.5%和4.6%的准确率,证明了其有效性。

52CV 2025-02-28 13:31 江苏




关注公众号,发现CV技术之美




AI生成内容已深度渗透至生活的方方面面,从艺术创作到设计领域,再到信息传播与版权保护,其影响力无处不在。然而,随着生成模型技术的飞速发展,如何精准甄别AI生成图像成为业界与学界共同聚焦的难题。

来自小红书生态算法团队、中科大、上海交通大学联合提出行业稀缺的全人工标注Chameleon基准和行业领先的AIDE检测方法。

团队经过分析,几乎所有模型都将Chameleon基准中AI生成的图像归类为真实图像。

于是他们提出了AIDE(具有混合特征的AI -generated Image DE tector ),它利用多个专家同时提取视觉伪影和噪声模式。最终分别比现有的最先进方法提高了 3.5% 和 4.6% 的准确率。


重新定义AI生成图像检测任务

Train-Test Setting-I:在现有研究中,AI 生成图像检测任务通常被设定为在一个特定的生成模型(如 GAN 或扩散模型)上训练模型,然后在其他生成模型上进行测试。

然而,通常来说,这种设定存在两个主要问题:

为了解决这些问题,团队提出了一个新的问题设定:

Train-Test Setting-II:鉴别器可以将多种生成模型的图像混合一起训练,然后在更具挑战性的、真实世界场景中的图像上进行测试。这种设定更符合实际应用中的需求,能够更好地评估模型的泛化能力和鲁棒性。

为了更真实地评估 AI 生成图像检测方法的性能,团队精心构建了Chameleon 数据集。

Chameleon数据集具有以下显著特点:


数据集构建

为构建一个能够真实反映 AI 生成图像检测挑战的高质量数据集,团队在数据收集、清洗和标注环节均采取了创新且严谨的方法,确保数据集的高质量和高逼真度。

数据收集:多渠道、高逼真度图像获取

与之前的基准数据集不同,团队从多个流行的 AI 绘画社区(如 ArtStation、Civitai 和 Liblib)收集了超过 150K 的 AI 生成图像,这些图像均由广泛的用户创作,使用了多种先进的生成模型(如 Midjourney、DALL·E 3 和 Stable Diffusion 等)。这些图像不仅在视觉上逼真,而且涵盖了丰富多样的主题和风格,包括人物、动物、物体和场景等。此外,还从 Unsplash 等平台收集了超过 20K 的真实图像,这些图像均由专业摄影师拍摄,具有高分辨率和高质量。所有图像均获得了合法授权,确保了数据的合法性和可用性。

相比之下,之前的基准数据集通常使用生成效果较差的模型生成图像,缺乏多样性和真实感,如下图所示。

数据清洗:多维度、精细化过滤

为确保数据集的高质量,团队对收集的图像进行了多维度、精细化的清洗过程:

数据标注:专业标注平台与多轮评估

为确保数据集的准确性和可靠性,团队建立了专门的标注平台,并招募了 20 名具有丰富经验的人类标注者对图像进行分类和真实性评估:

分类标注:标注者将图像分为人类、动物、物体和场景四类,确保数据集覆盖了多种现实世界中的场景和对象。

真实性评估:标注者根据“是否可以用相机拍摄”这一标准对图像的真实性进行评估。每个图像独立评估两次,只有当两名标注者均误判为真实时,图像才被标记为“高逼真”。

多轮评估:为确保标注的准确性,团队对标注结果进行了多轮审核和校对,确保每个图像的分类和真实性评估结果准确无误。

与之前的基准数据集不同,该数据集经过了严格的人工标注,确保了数据集的高质量和高逼真度。之前的基准数据集往往缺乏严格的人工标注,导致数据集中的图像质量和标注准确性参差不齐。

通过上述多维度、精细化的数据收集、清洗和标注过程,构建了一个高质量、高逼真度的 AI 生成图像检测基准数据集,为后续的研究和模型评估提供了坚实的基础。该数据集不仅在规模上更大,而且在图像质量和标注精度上也有了显著提升,能够更好地反映 AI 生成图像检测的实际挑战。

数据集对比

Chameleon数据集可以作为现有评测数据集的扩展,Chameleon数据集在规模、多样性和图像质量等方面均展现出显著优势:


AIDE模型:多专家融合的检测框架

在AI生成图像检测领域,现有的检测方法往往只能从单一角度进行分析,难以全面捕捉AI生成图像与真实图像之间的细微差异。

为了解决这一问题,研究者们提出了简单且有效的AIDE(AI-generated Image DEtector with Hybrid Features)模型,该模型通过融合多种专家模块,从低级像素统计和高级语义两个层面全面捕捉图像特征,实现了对AI生成图像的精准检测。

AIDE模型主要由两个核心模块组成:Patchwise Feature Extraction(PFE)模块和Semantic Feature Embedding(SFE)模块。这两个模块通过多专家融合的方式,共同为最终的分类决策提供丰富的特征信息。

Patchwise Feature Extraction(PFE)模块

PFE模块旨在捕捉图像中的低级像素统计特征,特别是AI生成图像中常见的噪声模式和纹理异常。具体而言,该模块通过以下步骤实现:

Semantic Feature Embedding(SFE)模块

SFE模块旨在捕捉图像中的高级语义特征,特别是物体共现和上下文关系等。具体而言,该模块通过以下步骤实现:

Discriminator模块

将PFE和SFE模块提取的特征在通道维度上进行融合,通过多层感知机(MLP)进行最终的分类预测。具体而言,首先对高频和低频特征图进行平均池化,得到低级特征表示;然后将其与高级语义特征进行通道级拼接,形成最终的特征向量;最后通过MLP网络输出分类结果。


实验结果

数据集:实验在AIGCDetectBenchmark、GenImage和Chameleon三个数据集上进行。AIGCDetectBenchmark和GenImage是现有的基准测试数据集,而Chameleon是研究者们新构建的更具挑战性的数据集。

模型对比:研究者选择了9种现成的AI生成图像检测器进行对比,包括CNNSpot、FreDect、Fusing、LNP、LGrad、UnivFD、DIRE、PatchCraft和NPR。

评价指标:实验采用分类准确率(Accuracy)和平均精度(Average Precision, AP)作为评价指标。

团队评测了AIDE在AIGCDetectBenchmark和GenImage上的结果,如下表所示:

AIDE模型在这两个数据集上的优异表现表明,融合低级像素统计和高级语义特征的方法能够有效捕捉AI生成图像与真实图像之间的差异,从而提高检测准确率。

随后在Chameleon benchmark上测评了9个现有的detectors,如下表所示。

同时团队可视化了,之前的SOTA方法PatchCraft在AIGCDetectBenchmark & GenImage 以及Chameleon上的表现

结果表明,之前在AIGCDetectBenchmark &GenImage上表现优异的模型,在Chameleon benchmark上均表现很差,这表明Chameleon数据集中的图像确实具有高度的逼真性,对现有检测模型提出了更大的挑战。

本论文通过对现有 AI 生成图像检测方法的重新审视,提出了一个新的问题设定,构建了更具挑战性的 Chameleon 数据集,并设计了一个融合多专家特征的检测器 AIDE。实验结果表明,AIDE 在现有的两个流行基准(AIGCDetectBenchmark 和 GenImage)上取得了显著的性能提升,分别比现有的最先进方法提高了 3.5% 和 4.6% 的准确率。然而,在 Chameleon 基准上,尽管 AIDE 取得了最好的性能,但与现有基准相比,仍存在较大的差距。

这表明,检测 AI 生成图像的任务仍然具有很大的挑战性,需要未来进一步的研究和改进。希望这一工作能够为这一领域的研究提供新的思路和方向,推动 AI 生成图像检测技术的发展。

尽管AIDE模型在AI生成图像检测领域取得了显著进展,但研究者们仍计划在未来的工作中进一步优化模型架构,探索更高效的特征提取和融合方法。

此外,研究者们还计划扩大Chameleon数据集的规模,涵盖更多类别、更多场景、更多生成模型的图像,以推动AI生成图像检测技术的进一步发展。

本文来自小红书投稿
最新 AI 进展报道
请联系:amos@52cv.net

END




欢迎加入「计算机视觉交流群?备注:CV




阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI生成图像检测 AIDE模型 Chameleon数据集
相关文章