机器之心 7小时前
让AI读懂「言外之意」:AI4SG团队发布首个心理健康污名语料库,破解隐性偏见识别难题
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

新加坡国立大学AI4SG实验室构建了首个基于专家标注的心理健康污名访谈语料库MHStigmaInterview,旨在帮助AI识别日常对话中的心理健康污名。该语料库基于心理学理论,包含7个核心污名维度,并通过聊天机器人收集自然对话样本。研究测试了主流大语言模型在该语料库上的表现,分析了污名化表达的隐蔽性及社会文化因素影响,为开发更精准的污名识别系统和反污名干预策略提供了资源。

🧠 MHStigmaInterview是首个基于专家标注的心理健康污名访谈语料库,包含7个核心污名维度:认知层面的责任归因、情感层面的愤怒/恐惧/怜悯,以及行为层面的拒绝帮助/强制隔离/社交距离。

🤖 研究团队采用聊天机器人Nova收集自然对话样本,通过破冰、情境植入和深度访谈三个阶段引导参与者,获得更真实的污名表达数据。

📊 语料库包含4,141个访谈片段,由684名不同背景的参与者贡献,平均2.11轮对话,总字符数超过17万,经专家双重标注,Cohen's kappa = 0.71。

🔍 分析显示,53.9%的回答没有表现出污名化态度,责任归因和社交距离是最常见的污名类型,恐惧和愤怒紧随其后。AI模型在该语料库上普遍存在高召回率、低精确率的问题,难以识别隐性污名表达。

🎯 通过对错误分类案例的分析,研究发现了污名化表达的策略和模式:距离化表达(如第三人称视角)、术语滥用(如随意使用心理学术语)、强制性措辞(如‘绝对需要’)、差别化支持(如过度小心)、家长制态度(如指导患者生活)、轻视化倾向(如简化问题为态度问题)。

🌍 社会文化因素分析显示,性别、年龄、文化背景和个人经历都会影响污名化态度,例如女性参与者某些维度上污名化倾向较少,有心理健康问题接触史的参与者更倾向于非污名化态度。

🚀 该语料库为开发更精准的污名化表达识别系统、设计个性化反污名干预策略、进行跨文化污名模式比较、评估不同干预方法效果、设计心理健康教育项目和医疗从业者培训、支持公共政策制定等提供了宝贵资源。

2025-08-07 17:39 北京

首个基于专家标注的心理健康污名访谈语料库 MHStigmaInterview

论文第一作者 Han Meng 是新加坡国立大学博士生,从事心理学构建的计算方法研究。通讯作者 Yi-Chieh Lee 是新加坡国立大学助理教授,在对话式人工智能、人机交互和心理健康技术领域开展研究工作。共同作者 Renwen Zhang 是南洋理工大学助理教授,专注于计算传播学研究,为本研究提供了传播学视角。Jungup Lee 是新加坡国立大学副教授,在心理健康领域有深入研究,为本研究提供了重要的领域知识支撑。

心理健康问题影响着全球数亿人的生活,然而患者往往面临着双重负担:不仅要承受疾病本身的痛苦,还要忍受来自社会的偏见和歧视。世界卫生组织数据显示,全球有相当比例的心理健康患者因为恐惧社会歧视而延迟或拒绝治疗。

这种「污名化」现象如同隐形的障碍,不仅阻碍了患者的康复之路,更成为了一个重要的社会问题。患者们在承受病痛的同时,还要面对来自不同社会环境中的偏见。更为复杂的是,这种污名化往往以微妙、隐蔽的形式存在于日常对话中,即使是先进的人工智能系统也难以有效识别。

尽管自然语言处理领域在仇恨言论、攻击性语言检测方面已有不少研究,但专门针对心理健康污名的计算资源却相对稀缺。现有数据集主要来源于社交媒体或合成数据,缺乏真实对话场景中的深层心理构建,且往往忽视了社会文化背景的重要性。

新加坡国立大学 AI4SG 实验室联合多学科专家团队,构建了首个基于专家标注的心理健康污名访谈语料库 MHStigmaInterview,希望为这一重要社会问题提供技术支持。该研究获得 ACL 2025 Oral 论文及高级领域主席奖(全会仅 47 篇获此荣誉)认可。


研究团队

该研究由新加坡国立大学 AI4SG 实验室主导,汇聚了人机交互、计算社会科学、人工智能伦理等多个领域的研究者。AI4SG 实验室专注于人机交互、计算社会科学、人机协作以及社会公益人工智能等交叉研究领域。

研究团队与心理健康领域专家密切合作,为 AI 和 NLP 研究引入了跨学科视角,为计算科学与社会科学的深度融合提供了一个探索案例。


理论驱动的框架设计

与传统依赖社交媒体数据的方法不同,MHStigmaInterview 建立在心理学理论基础上。研究团队采用了归因模型,将心理健康污名分解为七个核心维度:

认知层面:

情感层面:

行为层面:

这种理论驱动的标注体系,为后续的计算模型提供了相对明确的学习目标。


基于聊天机器人的数据收集

为了获得更自然的对话样本,研究团队设计了聊天机器人访谈系统。该系统通过三个阶段引导参与者:

系统会根据参与者回答的详细程度自动调整后续提问策略,以获得充分的信息。


数据集基本情况

经过严格的伦理审查和数据筛选,最终语料库包含:

数据分析显示:


AI 模型的表现

研究团队在该语料库上测试了当前主流的大语言模型,包括 GPT-4o、LLaMA-3 系列、Mistral 等。

性能表现:


隐性污名表达的深入分析

通过对 137 个错误分类案例的分析,研究团队发现了一些值得关注的模式。这些隐性污名化表达在日常对话中较为常见,但往往难以被识别。

语言层面的表达特点:

语义层面的深层模式:

这些发现揭示了现代社会中污名化表达的复杂性和隐蔽性,也说明了开发更精准识别系统的必要性。


社会文化因素分析

语料库记录了参与者的社会文化背景,初步分析显示了一些有趣的模式:

这些发现为理解污名化的社会根源提供了基本初步线索。


应用前景与未来方向

该语料库为多个研究方向提供了资源。

技术应用:

研究拓展:

社会应用:

MHStigmaInterview 语料库的发布为心理健康污名的计算研究提供了一个新的起点。虽然这是初步的探索,但它展示了技术在解决社会问题方面的潜力。通过持续的跨学科合作和技术改进,作者希望能够为构建更加包容的社会环境贡献一份力量。

这项工作指出,在追求技术进步的同时,关注技术的社会影响和人文关怀同样重要。只有将技术发展与社会需求紧密结合,才能真正实现技术向善的目标。

参考资料:


https://aclanthology.org/2025.acl-long.272.pdf

https://github.com/HanMeng2004/Mental-Health-Stigma-Interview-Corpus

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

心理健康 污名化 AI 自然语言处理 语料库
相关文章