掘金 人工智能 07月31日 09:51
原来工业 AI 异常检测只做了一半?AnomalyNCD 补上了“最关键一环”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

针对工业质检中“发现异常难识别”的痛点,华中科技大学等研究团队提出了AnomalyNCD通用框架。该框架结合异常检测与新类别发现(NCD)思想,通过主元素二值化(MEBin)提纯异常区域,利用掩码引导注意力机制(MGA)使ViT聚焦关键区域,并采用区域融合策略还原整图分类。AnomalyNCD在MVTec AD和MTD两大数据集上性能全面领先,尤其在识别新型未知缺陷方面表现突出。该框架能够自动适应未知异常,减少人工标注,并可扩展兼容多种检测器,有望赋能智能工厂实现更高效、智能的生产质检。

💡 **AnomalyNCD框架的提出旨在解决工业质检中“发现异常”到“理解异常”的跨越。** 现有方法仅能定位缺陷,却无法识别缺陷类型、追溯根源或发现未知异常。AnomalyNCD通过异常分类与新类别发现(NCD)能力,赋予系统“类比与认知”能力,解决了低语义场景下异常识别的难题。

🎯 **主元素二值化(MEBin)模块有效提纯异常区域,减少噪声干扰。** 该技术通过多阈值滑动统计区域数量变化,选择最稳定的异常区域,显著减少误分割,提高后续学习的准确性,从而提升整体检测质量。

👁️ **掩码引导注意力机制(MGA)确保ViT模型“看对地方”。** 在ViT的后九层引入该机制,将异常掩码转化为注意力引导,使模型聚焦于异常区域,即使预测掩码不精确,也能保证模型关注到关键的局部信息,提升了模型在工业场景的适应性。

📊 **面积加权融合策略实现从子图预测到整图分类的准确还原。** 针对一幅图中可能存在多个异常区域的情况,该策略根据异常子图的面积大小进行加权,有效降低了误检子图对整体判断的负面影响,确保了整图分类的鲁棒性。

🚀 **AnomalyNCD在权威数据集上表现卓越,并具备广泛应用前景。** 在MVTec AD和MTD数据集上,AnomalyNCD在NMI和F1指标上均大幅领先,且可自动适应未知异常,减少标注成本,支持与YOLO、PatchCore等检测器的结合,为智能工厂的视觉质检和下游流程提供了强大的技术支撑。

【导读】

在工业质检中,发现异常并不难,但“认识”异常却很难。现有检测方法大多只能告诉你“这有问题”,却无法说明“出了什么问题”,更别提识别此前未曾见过的“新型缺陷”。

为了解决这一痛点,华中科技大学等研究团队在CV领域最新论文中提出了AnomalyNCD,一个支持工业场景中异常分类与新类别发现的通用框架,兼容主流检测器,在MVTec AD和MTD两大数据集上全面领先。

过去已经有很多优秀的异常检测方法,能准确圈出“哪里不对劲”,但在实际工业应用中,这远远不够。如果不能进一步判断缺陷类型、归因问题根源、甚至识别此前从未见过的新型异常,就无法真正做到智能化的质检分析。而这正是当前大多数方法的“短板”。

AnomalyNCD的出现,就是为了解决这一从“检测”到“理解”的跨越。它不仅能识别异常,更能学习如何分类这些异常,甚至面对从未见过的缺陷类型,也能“自学成才”完成归类,真正赋予系统“类比与认知”能力。

项目开源地址:

github.com/HUST-SLOW/A…

为什么“发现异常”远远不够?

近年来,工业异常检测方法已能有效定位图像中的缺陷区域,但对于下游流程而言,仅仅检测“有问题”还远远不够。

例如,在实际生产中,我们不仅需要知道某个零件是否异常,还需要明确是哪一类问题——是裂纹、烧蚀还是磨损?更进一步,很多缺陷在初期甚至没有明确的定义,因此模型需要具备“发现未知异常类型”的能力,即异常多分类与新类别发现(Novel Class Discovery, NCD)。

但这并不容易。工业异常的“语义性”很弱,往往形态不显著、位于图像角落,现有方法在这种低语义场景中容易混淆背景与前景。

技术创新:三大模块构建强健异常识别框架

AnomalyNCD 结合异常检测与新类别发现(Novel Class Discovery, NCD)思想,构建了一个完整的异常多分类管线。核心包括三个创新设计:

工业检测容易产生伪异常(误检)和漏检。为了避免这些噪声影响学习,AnomalyNCD 首先设计了主元素二值化算法(MEBin),从检测器输出的异常热图中提取稳定出现的异常区域。

ViT虽强,但在工业场景容易“注意力跑偏”。作者提出掩码引导注意力机制,只引导 [CLS] token 聚焦于异常区域,同时保留其他token的全局感知能力。

由于每幅图中可能有多个异常区域,且部分区域是误检,作者提出面积加权融合策略,避免“平均投票”被噪声干扰:

实验结果:性能全面领先多个主流方法

AnomalyNCD不仅理论设计合理,在实际效果上也具备明显优势。论文在两个权威工业数据集上进行了充分对比实验:

仅使用未标注图像,与当前最强无监督聚类方法(AC)相比,NMI 提升 8.8%,F1 提升 10.8%(见表格1)。

结合一类检测器(如CPR)后,F1 高达 80.5%,比原方法高出近10个百分点(见表格2)。

引入主元素二值化(MEBin)后,F1 提升 7.2%,且在不同AD方法上均优于固定阈值方案。

掩码引导模块(MGA)在不同位置插入后,以“最后9层”为最佳配置(见表格5)。

伪标签修正策略(PLC)显著提升正常类识别的 recall(+14.9%)。

应用前景与意义

AnomalyNCD不仅兼容各种工业检测算法,还具备以下优势:

这意味着在未来的智能工厂中,算法不再只是“告诉你哪里坏了”,而是能够进一步 “告诉你坏在哪、坏了什么” ,让生产更加高效、智能、少人工。

总结

AnomalyNCD的提出,标志着工业异常检测进入一个全新阶段:从“发现异常”迈向“理解异常”。这一框架不仅增强了AI在工业质检中的智能程度,也为NCD在低语义场景中的落地应用提供了重要示范。未来,类似的自监督与掩码机制将成为提升工业智能的关键武器。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AnomalyNCD 工业质检 异常检测 新类别发现 计算机视觉
相关文章