量子位 05月31日 17:02
1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

MaskMark 是一种创新的局部鲁棒图像水印方法,由南洋理工大学和新加坡A*STAR前沿人工智能研究中心的研究人员提出。该方法旨在解决传统水印技术的局限性,如无法精确定位篡改区域、无法保护特定区域等问题。MaskMark 通过引入掩码机制,训练模型“看懂”水印位置,实现了多水印嵌入、精准定位篡改区域和灵活提取局部水印的功能。与现有技术相比,MaskMark 在多个任务中表现出卓越的性能,且训练成本更低,为AIGC图像版权保护和内容溯源提供了新的解决方案。

🖼️ **掩码机制:** MaskMark 引入掩码机制,训练模型识别水印位置。研究人员设计了两种版本:MaskMark-D 用于全图水印,MaskMark-ED 用于特定区域水印,从而实现精准的水印定位和提取。

⚙️ **核心技术流程:** MaskMark 的训练流程包括掩码生成、水印嵌入、水印掩码操作和水印提取四个阶段。推理时,解码器通过定位模块识别水印区域,减少干扰,从而恢复水印。

🥇 **卓越性能:** 在多项任务中,MaskMark 表现出卓越的性能。它在高视觉保真度下仍能保持近乎100%的比特准确率,在局部水印任务中表现优异,尤其在小面积嵌入场景中,MaskMark-ED 展现出更加出色的表现。此外,MaskMark 还具备精准水印定位和多水印嵌入能力。

🚀 **高效与扩展性:** MaskMark 训练效率高,仅需在单个A6000 GPU上训练约20小时,计算效率比现有模型高出15倍。它还支持不同比特长度的水印,并具备快速微调能力,以适应不同的鲁棒性需求和新兴威胁。

关注前沿科技 2025-05-31 11:34 北京

简单高效引入掩码

MaskMark团队 投稿量子位 | 公众号 QbitAI

给AI生成的作品打水印,让AIGC图像可溯源,已经成为行业共识。

问题是,传统水印方法通常把图像当成一个整体处理,全局嵌入、水印提取一锅端,存在不少“短板”:

比如,图像局部区域被篡改,就可能导致全局提取失败,也无法定位水印所在具体区域。

又比如,无法只保护某个区域,如人脸、LOGO等。

针对这个问题,现在,来自南洋理工大学和新加坡A*STAR前沿人工智能研究中心等机构的研究人员,提出了一种全新的局部鲁棒图像水印方法——MaskMark

该方法不仅在多个任务中全面超越Meta出品的SOTA模型WAM,而且训练成本只有它的1/15。

具体而言,MaskMark支持:

核心思路:让模型“看得见”水印在哪里

研究人员引入了一种掩码机制,训练时告诉模型“水印藏在这里”,教它学会精准地嵌入和提取。

他们给MaskMark设计了两个版本:

MaskMark-D(解码掩码)

MaskMark-ED(编码+解码掩码)

其中核心技术流程,是训练和推理的双重优化

MaskMark 的端到端训练流程主要包括四个阶段:

    掩码生成Mask Generation

    从四种预定义类型(全掩码、矩形掩码、不规则掩码、分割掩码)中随机选择或生成一个掩码M。

    水印嵌入(Watermark Embedding):

    编码器将水印比特嵌入原始图像(对于 MaskMark-ED可选择性地嵌入掩码M来指导嵌入位置),生成水印图像。此过程利用轻量级CNN处理水印比特,并结合U-Net结构及JND模块优化视觉效果。

    水印掩码操作(Watermark Masking):
    使用掩码M融合,生成,即仅在掩码区域保留水印。随后对施加随机失真得到

    并再次用M裁剪出仅含水印信号的区域

    水印提取(Watermark Extraction):

    解码器从中预测掩码,并从中提取水印比特。解码器包含专门用于掩码预测的 U2-Net 和用于水印提取的U-Net及CNN模块。

MaskMark推理时,解码器首先利用定位模块识别含水印区域,将非水印区域置零以减少干扰,然后从保留区域恢复水印,这对于小区域水印提取尤为重要。

在多项不同的任务上均表现出SOTA的性能

研究人员在多项不同任务上验证了MaskMark的性能。

首先,MaskMark能实现高提取精度

在全局水印任务中,即使在高视觉保真度(PSNR > 39.5, SSIM > 0.98)下,MaskMark-D和MaskMark-ED仍能保持近乎100%的比特准确率,尤其在各类值度量和几何失真攻击下表现优异,显著优于现有基线模型。

在局部水印任务中,实验表明,当水印信号分布在图像的不同大小区域时,MaskMark仍能保持近乎100%的提取准确率,显著优于其他全局方法,并超过当前最先进的局部水印模型WAM。尤其在小面积嵌入场景中,MaskMark-ED展现出更加出色的表现。

其次,MaskMark能实现精准水印定位

在不同水印区域比例和失真条件下,其定位性能(以IoU衡量)均优于EditGuard和WAM等方法。MaskMark-ED在小区域定位上更具优势。

MaskMark还具备多水印嵌入能力

尽管并非为此专门训练,MaskMark-ED在单个图像中嵌入多达5个不同水印时,依然保持强大的提取和定位性能,优于WAM。

高效性和扩展性方面,训练效率上,MaskMark仅需在单个A6000 GPU上训练约20小时,计算效率(TFLOPs衡量)比WAM高出15倍。

消息长度方面,MaskMark可轻松扩展至不同比特长度(如32、64、128位),并保持较高性能,而WAM则受限于32位。

另外,MaskMark还支持快速微调*

通过简单调整失真层或进行少量微调(如针对VAE自适应攻击,仅需20k训练步数),MaskMark即可适应不同鲁棒性需求和新兴威胁。

论文链接:https://arxiv.org/abs/2504.12739代码链接:https://github.com/hurunyi/maskmark

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🌟 点亮星标 🌟

科技前沿进展每日见

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MaskMark 图像水印 AIGC 版权保护 人工智能
相关文章