PaperWeekly 07月22日 01:37
ICCV 2025 | 破解安防行为识别困局:从“找谁”到“在干嘛”,带来智能守护新可能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

城市安防面临“最后一公里”痛点,现有系统难以识别行人异常行为。西安交通大学等研究团队在ICCV 2025上提出“Beyond Walking”方案,构建了百万级图文基准“行人异常行为数据集(PAB)”,包含超过101万张合成图像和1978张真实测试图像,覆盖多种异常行为。同时,他们开发了“跨模态姿态感知(CMP)”框架,融合姿态信息并采用“找茬”训练法,大幅提升了异常行为的识别准确率,为城市安全升级和效率提升提供了新的技术范式。

🎯 **解决安防“视而不见”的痛点**:现有安防系统主要依赖文本检索来识别行人身份,但无法有效识别跌倒、袭击、冲突等异常行为。新提出的“行人异常检索”任务旨在通过自然语言描述,精准定位视频中发生异常行为的行人,弥补了传统技术的短板。

📊 **发布百万级“行人异常行为数据集(PAB)”**:该数据集包含超过101万张高质量合成训练图像和1978张真实世界测试图像,构建了大规模图文对,覆盖了包括跌倒、被撞击等在内的多种关键异常行为,解决了异常行为数据稀缺和标注成本高昂的问题。

💡 **“跨模态姿态感知(CMP)”框架创新**:该框架通过融合人体姿态信息来理解动作语义,并采用“基于身份的困难负样本挖掘(IHNM)”策略,有效解决了“长得像但行为不同”的混淆情况,显著提升了异常行为检索的准确率,在真实测试集上达到84.93%的Recall@1。

🚀 **推动城市安全与效率双重升级**:该技术为智慧城市和公共安防系统注入了“行为理解引擎”,能够实现跌倒检测、突发冲突预警等功能,并通过自然语言描述快速检索关键事件录像,极大地提高了安防工作的效率和智能化水平。

🌐 **为AI行为理解奠定基础**:这项研究突破了异常行为数据获取的瓶颈,为人工智能更深层次地理解复杂场景中的人类行为铺平了道路,预示着城市安防正迈向一个更智能、更主动的新时代。

原创 让你更懂AI的 2025-07-15 23:55 北京

安防摄像头遍布大街小巷,但当有人突然摔倒、遭遇袭击,或在公共场所做出危险举动时,现有系统却常常“视而不见”? 

问题核心在于:当前基于文本的行人检索技术,像个只会认“走路”和“站立”的“脸盲”——它擅长找特定的人,却对异常行为本身束手无策。

想象一下:老人不慎跌倒、孩童走失惊慌奔跑、突发冲突有人被推搡··· 这些关键瞬间的识别与报警,正是城市安防的“最后一公里”痛点。现有技术对此力不从心,急需能理解行为语义的智能安防。

西安交通大学、合肥工业大学、澳门大学的研究团队,在 ICCV 2025 上提出从数据收集到跨模态建模全流程方案。论文、代码、数据集已开源!立即探索未来安防新范式:

论文标题:

Beyond Walking: A Large-Scale Image-Text Benchmark for Text-based Person Anomaly Search

论文链接:

https://arxiv.org/abs/2411.17776

数据集 & 代码:

https://github.com/Shuyu-XJTU/CMP


新任务:基于文本的「行人异常检索」

▲  新任务——基于文本的行人异常检索(右)与传统的基于文本的行人检索(左)的比较。


百万级图文基准:「行人异常行为数据集(PAB)」发布!

▲ PAB 与现有基于文本的行人检索和视频异常检测数据集在数据质量和数量方面的综合比较

▲ 不同任务的数据集属性(左)与PAB数据集示例(右)


「火眼金睛」框架:跨模态姿态感知(CMP)

▲ 跨模态姿态感知(CMP)框架概述


实验结果

定量结果。表 2 展示了 CMP 与一系列可能的解决方案的实验结果比较。

OOD 场景。表 3 展示了用于评估 CMP 模型的可扩展性,进行的 Out-of-Distribution(OOD)测试结果。

行为检索 v.s. 身份检索。如表 4 所示,传统身份检索方法将具有相同 ID 的所有图像视为正确匹配,异常检索任务需要精确定位特定行为。

定性结果。

▲ 文本查询的 Top-5 异常检索结果


为什么这很重要?

当城市安防系统真正学会“察言观色”,看懂行人的“一举一动”,百万图文对构建的“异常图鉴”正在让这一未来加速到来。关注 ICCV 2025,关注 AI 如何为城市安全筑牢“智能防线”!

更多阅读

#投 稿 通 道#

 让你的文字被更多人看到 


如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿


△长按添加PaperWeekly小编


🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧


·

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI安防 行为识别 行人异常检索 计算机视觉 智慧城市
相关文章