Datawhale 2024年08月14日
第一次出国参会, ICML 2024@Datawhale
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

论文提出RMIB用于匹配文本表示,以提高非对称域文本匹配任务的泛化能力,在多个模型和数据集上进行了验证

🎯RMIB通过将文本表示与相同先验分布匹配来缩小分布,理论上证明此操作相当于优化信息瓶颈(IB),且IB不限制文本表示间的交互

💡由于文本表示间的交互在非对称域文本匹配中重要,RMIB提出交互的充分性和单个文本表示的不完整性,理论上证明其对文本表示的约束相当于在给定任务信息前提下最大化文本表示间的互信息

✅在四个文本匹配模型和五个文本匹配数据集上,验证了RMIB可提高非对称域文本匹配的性能

2024-07-26 22:04 浙江

Datawhale发顶会了?,代码完全开源

《RMIB: Representation Matching Information Bottleneck for Matching Text Representations》

文本表示匹配中的表示匹配信息瓶颈(RMIB)

【作者】:潘海辉,猎户星空算法工程师、谢文睿,Datawhale

【摘要】:最近的研究表明,文本表示的域匹配将有助于提高非对称域文本匹配任务的泛化能力。这就要求文本表示的分布要尽可能的相似,类似于与异构数据域的匹配,才能使得特征提取后的数据不可区分。然而,如何匹配文本表示的分布仍然是一个悬而未决的问题,并且文本表示分布匹配的作用仍不清楚。在本论文中,我们通过将文本表示与相同的先验分布进行匹配来明确缩小文本表示的分布。我们从理论上证明,缩小非对称域文本匹配中文本表示的分布相当于优化信息瓶颈(IB)。由于文本表示之间的交互在非对称域文本匹配中起着重要作用,因此IB不限制文本表示之间的交互。因此,我们在IB的基础上提出交互的充分性和单个文本表示的不完整性,并获得表示匹配信息瓶颈(RMIB)。我们从理论上证明RMIB中对文本表示的约束相当于在给定任务信息的前提下最大化文本表示之间的互信息。在四个文本匹配模型和五个文本匹配数据集上,我们验证了RMIB可以提高非对称域文本匹配的性能。

OpenreView 地址:

https://openreview.net/forum?id=hsHIxrnrMx

Github 开源代码:

https://github.com/chenxingphh/rmib

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RMIB 文本匹配 信息瓶颈 互信息
相关文章