Datawhale 2024年10月21日
CCF 大模型安全挑战赛获奖队伍公示!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

中国计算机学会(CCF)举办的CCF 大模型安全挑战赛于2024年8月6日圆满落幕,该赛事旨在推动大模型技术的安全发展和负责任的应用。赛事设置两个赛道任务:通用的大模型目标劫持和内容安全检测器的红队攻击,吸引了来自全国各地的数十所高校、科研院所及相关企业共计679支参赛队伍。本次赛事奖金池总计人民币30万元,每个赛道分别设置15万元,颁奖仪式将于10月26日在浙江横店举行的CNCC2024-大模型的安全与超级对齐论坛举行。

😄 **通用的大模型目标劫持赛道**:该赛道旨在评估大模型在面对恶意攻击时的鲁棒性。参赛者需要设计攻击指令,使大模型放弃初始任务而执行主办方指定的目标任务。 该赛道旨在评估大模型在面对恶意攻击时的鲁棒性,参赛者需要设计攻击指令,使大模型放弃初始任务而执行主办方指定的目标任务。例如,参赛者可以设计一个攻击指令,使大模型在翻译英文文本时,将部分英文单词替换成中文,从而达到干扰大模型翻译效果的目的。这个赛道考验了参赛者对大模型的理解,以及设计攻击指令的能力。

🤔 **内容安全检测器的红队攻击赛道**:该赛道旨在评估内容安全检测模型的有效性。参赛者需要自主构建query-response的单轮对话,诱导内容安全检测模型误判对话回复的安全性。 该赛道旨在评估内容安全检测模型的有效性。参赛者需要自主构建query-response的单轮对话,诱导内容安全检测模型误判对话回复的安全性。例如,参赛者可以设计一个对话,让大模型生成一些带有歧视性或暴力色彩的言论,并通过巧妙的语言技巧,使这些言论能够绕过内容安全检测模型的识别。这个赛道考验了参赛者对内容安全检测模型的理解,以及设计诱导性对话的能力。

🎉 **颁奖仪式**:颁奖仪式将于10月26日在浙江横店举行的CNCC2024-大模型的安全与超级对齐论坛举行,届时论坛主席及来自相关支持单位的嘉宾将为获奖队伍颁发证书,并对他们的优异表现给予表彰。 颁奖仪式将于10月26日在浙江横店举行的CNCC2024-大模型的安全与超级对齐论坛举行,届时论坛主席及来自相关支持单位的嘉宾将为获奖队伍颁发证书,并对他们的优异表现给予表彰。CNCC2024-大模型的安全与超级对齐论坛由CCF大模型论坛常务委员、清华大学黄民烈教授;中国人民大学严睿教授担任共同主席,汇聚了来自各个领域的专家学者,共同探讨大模型及超级智能所面临的安全挑战与对齐问题。与会专家将分享最新研究成果,交流实践经验,致力于推动大模型技术的安全发展和负责任的应用。

🏆 **获奖团队**:本次赛事奖金池总计人民币30万元,每个赛道分别设置15万元。具体获奖情况如下所示: 本次赛事奖金池总计人民币30万元,每个赛道分别设置15万元。具体获奖情况如下所示: * 赛道1:「通用的大模型目标劫持」获奖团队:... * 赛道2:「内容安全检测器的红队攻击」获奖团队:...

2024-10-20 22:28 浙江

 Datawhale赛事 

主办单位:中国计算机学会 (CCF)

大模型技术蓬勃发展,大模型应用潜在的安全风险与隐患也日益凸显,引起国内外广泛关注和担忧。确保大模型准确响应用户指令并保证输出内容的安全合规性,对于其在实际业务场景中的应用至关重要。

赛事概况

针对前述问题,中国计算机学会(CCF)作为主办单位,中国计算机学会大模型论坛执行委员会(CCF FoLM)作为承办单位,携手清华大学基础模型研究中心举办了CCF 大模型安全挑战赛活动。本届挑战赛自 2024 年 6 月 20 日启动,2024 年 8 月 6 日截止。挑战赛设置两个赛道任务:「通用的大模型目标劫持」和「内容安全检测器的红队攻击」,吸引了来自全国各地的数十所高校、科研院所及相关企业共计679支参赛队伍。

获奖情况

本次赛事奖金池总计人民币 30 万元,每个赛道分别设置 15 万元。具体获奖情况如下所示:

赛道 1:通用的大模型目标劫持

赛题背景:确保大模型准确响应用户指令,对其在实际业务中的应用至关重要。然而,大模型面临任务指令被劫持的风险,即通过在初始任务指令后添加劫持指令,令模型放弃初始任务而执行特定劫持任务,严重影响其可用性

赛题描述:主办方为大模型设定初始任务,参赛者需要设计攻击指令进行劫持,使大模型放弃初始任务而执行主办方指定的目标任务。

获奖团队:

赛道 2:内容安全检测器的红队攻击

赛题背景:对大模型生成内容进行安全检测,是确保其安全输出的重要环节。然而,随着大模型语言能力的增强,其可能通过丰富的语言技巧生成隐式的不安全内容,绕过内容安全检测,导致不安全输出

赛题描述:参赛者自主构建 query-response 的单轮对话,诱导内容安全检测模型误判对话回复的安全性

获奖团队:

颁奖仪式

颁奖仪式将于「10月26日」于浙江横店举行的 CNCC2024-大模型的安全与超级对齐论坛举行,届时论坛主席及来自相关支持单位的嘉宾将为获奖队伍颁发证书,并对他们的优异表现给予表彰。

CNCC2024-大模型的安全与超级对齐论坛由 CCF 大模型论坛常务委员、清华大学黄民烈教授;中国人民大学严睿教授担任共同主席,汇聚了来自各个领域的专家学者,共同探讨大模型及超级智能所面临的安全挑战与对齐问题。与会专家将分享最新研究成果,交流实践经验,致力于推动大模型技术的安全发展和负责任的应用。

组织信息

有任何疑问,请联系大赛组委会:llmsafetycomp@yeah.net

 


关于 2024 年中国计算机大会(CNCC)

2024 年中国计算机大会(CNCC)将于 10 月 24-26 日在浙江省东阳市横店举办,大会主题为“发展新质生产力,计算引领未来”。

CNCC 是一个宏观论述技术趋势的大会,具有规格高、规模大、内容丰富等特点,会议形式包括大会特邀报告、大会论坛、技术论坛、特色活动及展览。

CNCC2024 汇聚图灵奖获得者、两院院士、国内外顶尖学者、知名企业家等亲临大会,展望前沿趋势,分享创新成果。ACM、IEEE CS、IPSJ、KIISE 等国际计算机组织的代表也多次获邀现场参加这一盛会。


感谢所有参赛者的积极参与以及各支持单位的鼎力支持,期待大家相聚CNCC2024-大模型的安全与超级对齐论坛,共同为大模型的安全治理贡献力量!

一起“三连

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

大模型安全 CCF 挑战赛 内容安全 目标劫持 红队攻击 CNCC2024
相关文章