华尔街见闻 - 资讯 - undefined 03月04日
上交CVPR满分论文数据蒸馏技术,直接把GPU显存“砍掉”300倍
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

上海交通大学等机构在CVPR 2025上发表的论文,提出了一种名为NCFM(神经特征函数匹配)的全新数据集蒸馏方法,该方法在大幅提升数据蒸馏性能的同时,显著降低了GPU显存占用和训练时间。相较于现有方法,NCFM通过Minmax博弈视角和神经特征函数差异(NCFD)度量指标,实现了更高效、更鲁棒的数据集蒸馏。实验结果表明,NCFM在多个数据集上均超越了现有SOTA方法,并在资源效率上取得了质的飞跃,仅用2.3GB显存即可完成CIFAR-100的无损蒸馏。

💡**Minmax博弈视角**: NCFM将数据集蒸馏问题定义为Minmax优化,通过“矛”(差异度量网络)和“盾”(合成数据)的对抗学习,自适应地学习更鲁棒的差异度量指标NCFD,并生成更高质量的合成数据。

📊**神经特征函数差异(NCFD)**: NCFD利用特征函数刻画数据分布,通过轻量级神经网络学习频率参数的采样策略,动态调整采样策略,最大化差异度量,相比MMD等方法,计算复杂度更低,效率更高。

⚖️**相位与幅度的平衡**: NCFM在NCFD计算中关注神经网络特征在复数域的相位和幅度信息,相位编码数据的中心和模式,保证真实性;幅度反映数据的尺度和范围,提升多样性。通过平衡两者,提升蒸馏性能。

给大家分享一项在计算机视觉顶会CVPR 2025上被接收的重磅研究,来自上海交通大学,上海人工智能实验室等机构,论文名为 《Dataset Distillation with Neural Characteristic Function: A Minmax Perspective》(基于神经特征函数的数据集蒸馏:一个 Minmax 视角)

这项研究可以说是在数据蒸馏领域投下了一颗“深水炸弹”,它提出了一种全新的方法NCFM (Neural Characteristic Function Matching,神经特征函数匹配),不仅大幅提升了数据蒸馏的性能,更在资源效率上实现了质的飞跃!

相比于DATM等SOTA方法,NCFM的GPU显存占用降低了300倍以上!训练速度提升了20倍!更令人震惊的是,NCFM仅用2.3GB显存,就在单张NVIDIA2080TiGPU上成功完成了CIFAR-100的无损蒸馏!这在之前是难以想象的。

话不多说,我给大家划个重点。

背景:大数据时代的“瘦身术”——数据集蒸馏

在人工智能领域,我们常说“数据为王”。 模型要强大,海量数据少不了。 然而,大数据也带来了新的挑战:

为了解决这些问题,数据蒸馏 (Dataset Distillation)技术应运而生。 它的目标就像给数据集做“瘦身”, 用少量合成数据 (Synthetic Data) “浓缩” 原始大数据集 (Real Data) 的精华信息,让模型仅用这些“迷你”数据就能达到甚至超越在原始数据集上的训练效果。

现有方法的困境: “像素级”匹配 vs. “分布级”差异

目前,数据集蒸馏方法主要分为两大类:

简单来说,现有方法要么过于简单粗暴,无法捕捉数据的深层分布;要么计算复杂,效率不高。这就限制了数据集蒸馏技术的进一步发展。

NCFM: Minmax 博弈下的“神经特征函数”

为了突破现有方法的瓶颈,NCFM 从全新的 Minmax 博弈视角出发, 引入了 “神经特征函数差异 (Neural Characteristic Function Discrepancy, NCFD)” 这一创新度量指标。

1. Minmax 博弈: “矛与盾”的对抗学习

NCFM 将数据集蒸馏问题重新定义为一个 Minmax 优化问题,就像一场“矛与盾”的对抗游戏:

通过 “矛与盾” 的不断对抗和迭代优化,NCFM 能够 自适应地学习到一个更鲁棒、更有效的差异度量指标 (NCFD), 并生成更高质量的合成数据。 这种 Minmax 框架与 GANs 的对抗生成思想有异曲同工之妙,但目标和实现方式却截然不同。

2. NCFD: 基于“特征函数”的全面分布刻画

NCFD 的核心创新在于 “神经特征函数差异” 这一度量指标。 它巧妙地利用了特征函数 (Characteristic Function, CF)的强大能力来刻画数据分布

什么是特征函数 (CF)?简单来说, 特征函数就是概率密度函数的傅里叶变换。它具有以下关键优势:

NCFD 如何“神经”?NCFM 并没有直接使用传统的特征函数,而是引入了一个轻量级的神经网络 ψ 来学习特征函数的频率参数 t 的采样策略。这样做的好处是:

3. 相位 (Phase) 与幅度 (Amplitude) 的精妙平衡

NCFM 在 NCFD 的计算中, 特别关注了神经网络特征在复数域的 “相位 (Phase)” 和 “幅度 (Amplitude)” 信息

NCFM 通过精妙地平衡相位和幅度信息, 使得合成数据既能保持真实感,又能兼顾多样性, 从而显著提升了蒸馏性能

实验结果: 性能与效率的双重 “王炸”

实验结果充分证明了 NCFM 的卓越性能和效率:

本文来源:AI寒武纪,原文标题:《上交CVPR 满分论文数据蒸馏技术,直接把 GPU 显存 “砍掉” 300 倍》

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

数据集蒸馏 NCFM Minmax博弈 神经特征函数 CVPR 2025
相关文章