Machine Intelligence Research

澳大利亚国立大学Nick Barnes教授团队通过一种简单而高效的自监督学习方法,从分布外视角重新思考结直肠息肉的分割问题。与现有的全监督方法不同,本文利用掩码自动编码器——一种在重建任务上进行训练的自监督视觉变换器——来学习分布内特征表示,即健康结肠图像的分布。然后,本文执行分布外重建和推理,通过特征空间标准化将多样化异常样本的潜在分布与健康样本的统计量相对齐。通过计算输入图像与重建图像之间的差异,为图像生成逐像素异常分数,并使用此信号进行分布外(即息肉)分割。在六个基准实验上的结果表明,本文的模型具备出色的分割性能,并且能够在不同数据集之间进行泛化。

本文代码公开可用,地址为

https://github.com/GewelsJI/Polyp-OOD.

图片来自Springer

全文下载:

Rethinking Polyp Segmentation From An Out-of-distribution Perspective

Ge-Peng Ji, Jing Zhang, Dylan Campbell, Huan Xiong & Nick Barnes

https://link.springer.com/article/10.1007/s11633-023-1472-2

https://www.mi-research.net/en/article/doi/10.1007/s11633-023-1472-2

全文导读

结直肠癌是全球癌症相关死亡的第三大原因。结肠、直肠癌在早期局限期的5年生存率分别高达91%、90%。然而,根据美国癌症协会维护的SEER统计数据,结直肠癌在区域转移(72%、74%)和远处转移(13%、17%)期的生存率显著下降。从临床实践来看,定期的结肠镜检查对于癌症预防至关重要,旨在发现和去除癌前息肉生长(例如异常的结肠或直肠息肉)以防止其恶变。此过程通常依赖于医生的经验,而经验不足的医生可能无法识别癌前病变状况,自动化息肉分割技术应运而生。

在过去的几十年里,研究人员广泛探索了数据驱动范式,即使用全监督策略来分割结直肠息肉。然而,它们都存在一些数据方面的限制:1)数据多样性不足:由于在结肠镜检查中息肉出现的频率较低,很难收集到多样化的阳性样本(即息肉样本),而阴性样本则相对容易收集;2)标注成本高:只有经验丰富的医生才能为医疗图像提供真实标注,这导致数据标注成本高昂。为缓解上述问题,数据高效学习成为一种潜在的解决方案,即发挥智能学习器本身的潜力,减少人工监督,例如半监督和弱监督策略。然而,这些方法在训练过程中仍然需要大量的阳性样本。此外,与全监督环境相比,半标注或弱标注的数据可能会导致更严重的模型偏差。

另外,还可以选择无监督异常分割方案,即在分析异常样本时,专门对正常结肠镜检查图像进行训练的模型可以识别异常区域。此前的方法使用对比学习构建了一个单类分类器,其中设计了辅助预训练任务(例如使用合成或增强图像)来区分正常和异常模式。它们的性能高度依赖于设计精密的训练流程,并且存在过度拟合伪异常模式的风险。而基于重建的方法则是通过在医学图像上进行自监督训练来解决此类问题,其基本假设是训练重建分布内(ID)样本的自动编码器无法有效重建分布外(OOD)样本,即结直肠息肉。然而,最新研究表明,简单的自动编码器依然可以以相对较低的误差重建OOD样本,这表明该框架不能直接使用。为解决这一问题,Tian等研究者提出了一种基于掩码自动编码器的大掩码比率的记忆增强自注意编码器和多级交叉注意解码器,目的是在异常区域获得高重建误差。以往的研究通常使用不同的训练流程使模型的架构复杂化,与此不同的是,本文通过使用阴性(健康)样本使训练流程简化,然后执行数据自适应推断,以识别异常区域。

本文所提的息肉-OOD模型

本文认为,与健康数据相比,医学上的异常数据可以被视为分布外数据(OOD),这可以将结直肠息肉分割定义为逐像素的OOD检测任务。本文的基本假设是异常区域的分布与健康样本是不同的。遵循基于重建的检测原理,本文直接使用掩码自动编码器(MAE)的训练流程,并利用重建误差来分配异常分数。接下来,将推理任务转换为逐像素的OOD检测任务,这使我们能够从MAE的强大分布建模能力中受益。然而,本文发现结直肠息肉在外观上差异显著,其在隐藏空间有着非常不同的表征。这种情况下直接用MAE会出现问题,因为结直肠息肉特征没有紧密分布,导致网络识别它们的能力降低。为了解决该问题,本文提出执行特征空间内部标准化,从而生成分布紧凑且显著的结直肠息肉区域特征表示,以实现简单有效的推理。

本研究的主要贡献是:1)将息肉分割任务重新定义为分布外检测问题;2)使用掩码自动编码器学习健康样本的分布,通过易于获取的健康样本即可进行训练;3)验证特征空间标准化提高了网络推理时对于异常区域的识别能力,并且能够在不同数据集间泛化。本文所提方法在无监督异常(即息肉)分割方法中表现出色。

· 本文作者 ·

全文下载:

Rethinking Polyp Segmentation From An Out-of-distribution Perspective

Ge-Peng Ji, Jing Zhang, Dylan Campbell, Huan Xiong & Nick Barnes

https://link.springer.com/article/10.1007/s11633-023-1472-2

https://www.mi-research.net/en/article/doi/10.1007/s11633-023-1472-2

BibTex:

@Article{MIR-2023-06-092,

author={Ge-Peng Ji,  Jing Zhang,  Dylan Campbell,  Huan Xiong,  Nick Barnes},

journal={Machine Intelligence Research},

title={Rethinking Polyp Segmentation from An Out-of-distribution Perspective},

year={2024},

volume={21},

issue={4},

pages={631-639},

doi={10.1007/s11633-023-1472-2} }

特别感谢本文第一作者、澳大利亚国立大学季葛鹏博士对以上内容的审阅和修改!
纸刊免费寄送
Machine Intelligence Research

MIR为所有读者提供免费寄送纸刊服务,如您对本篇文章感兴趣,请点击下方链接填写收件地址,编辑部将尽快为您免费寄送纸版全文!

说明:如遇特殊原因无法寄达的,将推迟邮寄时间,咨询电话010-82544737

收件信息登记:

https://www.wjx.cn‍/vm/eIyIAAI.aspx#  

关于Machine Intelligence Research

Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划",已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等20余家国际数据库收录,入选图像图形领域期刊分级目录-T2级知名期刊。2022年首个CiteScore分值在计算机科学、工程、数学三大领域的八个子方向排名均跻身Q1区,最佳排名挺进Top 4%,2023年CiteScore分值继续跻身Q1区。2024年获得首个影响因子(IF) 6.4,位列人工智能及自动化&控制系统两个领域JCR Q1区。

往期目录
2024年第3期 | 分布式深度强化学习,知识图谱,推荐系统,3D视觉,联邦学习...
2024年第2期 | 大语言模型、零信任架构、常识知识推理、肿瘤自动检测和定位...
2024年第1期 | 特约专题: AI for Art
2023年第6期 | 影像组学、机器学习、图像盲去噪、深度估计...
2023年第5期 | 生成式人工智能系统、智能网联汽车、毫秒级人脸检测器、个性化联邦学习框架... (机器智能研究MIR)
2023年第4期 | 大规模多模态预训练模型、机器翻译、联邦学习......
2023年第3期 | 人机对抗智能、边缘智能、掩码图像重建、强化学习... 
2023年第2期 · 特约专题 | 大规模预训练: 数据、模型和微调
2023年第1期 | 类脑智能机器人、联邦学习、视觉-语言预训练、伪装目标检测... 
2022年第6期 | 因果推理、视觉表征学习、视频息肉分割...
2022年第5期 | 重磅专题:类脑机器学习
2022年第4期 | 来自苏黎世联邦理工学院Luc Van Gool教授团队、清华大学戴琼海院士团队等
2022年第3期 | 聚焦自然语言处理、机器学习等领域;来自复旦大学、中科院自动化所等团队
2022年第2期 | 聚焦知识挖掘、5G、强化学习等领域;来自联想研究院、中科院自动化所等团队
主编谭铁牛院士寄语, MIR第一期正式出版!
好文推荐
前沿观点 | Segment Anything并非一直完美: SAM模型在不同真实场景中的应用调查
精选好文 | 推荐系统的波纹知识图谱卷积网络
复旦邱锡鹏团队 | MOSS: 一个开源的对话式大语言模型
自动化所黄凯奇团队 | 分布式深度强化学习:综述与多玩家多智能体学习工具箱
约翰霍普金斯大学Alan Yuille团队 | 从时序和高维数据中定位肿瘤的弱标注方法
专题综述 | 大语言模型中的知识生命周期
精选综述 | 零信任架构的自动化和编排: 潜在解决方案与挑战
欧洲科学院院士蒋田仔团队 | 脑成像数据的多模态融合: 方法与应用
金耀初团队&郑锋团队 | 综述: 深度工业图像异常检测
专题好文 | 创新视听内容的联合创作: 计算机艺术面临的新挑战
下载量TOP好文 | 人工智能领域高下载文章集锦 (2022-2023年)
引用量TOP好文 | 人工智能领域高引用文章集锦 (2022-2023年)
综述 | 清华张学工教授: 肺癌影像组学中的机器学习
哈工大江俊君团队 | DepthFormer: 利用长程关联和局部信息进行精确的单目深度估计
Luc Van Gool团队 | 通过Swin-Conv-UNet和数据合成实现实用图像盲去噪
贺威团队&王耀南院士团队 | 基于动态运动基元的机器人技能学习
乔红院士团队 | 类脑智能机器人:理论分析与系统应用 (机器智能研究MIR)
南科大于仕琪团队 | YuNet:一个速度为毫秒级的人脸检测器
上海交大严骏驰团队 | 综述: 求解布尔可满足性问题(SAT)的机器学习方法
西电公茂果团队 | 综述: 多模态数据的联邦学习
高文院士团队 | 综述: 大规模多模态预训练模型
前沿观点 | 谷歌BARD的视觉理解能力如何?对开放挑战的实证研究
港中文黄锦辉团队 | 综述: 任务型对话对话策略学习的强化学习方法
南航张道强教授团队 | 综述:用于脑影像基因组学的机器学习方法
ETHZ团队 | 一种基于深度梯度学习的高效伪装目标检测方法 (机器智能研究MIR)
Luc Van Gool团队 | 深度学习视角下的视频息肉分割
专题综述 | 高效的视觉识别: 最新进展及类脑方法综述
北大黄铁军团队 | 专题综述:视觉信息的神经解码
专题综述 | 迈向脑启发计算机视觉的新范式
专题好文 | 新型类脑去噪内源生成模型: 解决复杂噪音下的手写数字识别问题
戴琼海院士团队 | 用以图像去遮挡的基于事件增强的多模态融合混合网络
ETH Zurich重磅综述 | 人脸-素描合成:一个新的挑战
华南理工詹志辉团队 | 综述: 面向昂贵优化的进化计算
东南大学张敏灵团队 | 基于选择性特征增广的多维分类方法
联想CTO芮勇团队 | 知识挖掘:跨领域的综述
复旦邱锡鹏团队 | 综述:自然语言处理中的范式转换
MIR资讯
挺进Q1区前10名!MIR首个影响因子发布
特别提醒!请认准MIR官方渠道,谨防受骗
2024年 AI 领域国际学术会议参考列表
MIR 优秀编委 & 优秀审稿人 & 高被引论文 (2023年度)
年终喜报!MIR科技期刊世界影响力指数跻身Q1区 (含100份龙年礼包)
最新 | 2023研究前沿及热点解读 (附完整PDF)
前进20名!MIR再度跻身国际影响力TOP期刊榜单
喜报 | MIR入选图像图形领域 T2级 “知名期刊”!
双喜!MIR入选”2022中国科技核心期刊”,并被DBLP收录 | 机器智能研究MIR
报喜!MIR入选2022年国际影响力TOP期刊榜单
喜报 | MIR被 ESCI 收录!
喜报 | MIR 被 EI 与 Scopus 数据库收录