PaperWeekly 2024年12月27日
直播预告 | 复旦大学知识工厂实验室:基于解码的语言模型水印研究
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本次直播将探讨大语言模型水印研究,包括流行的水印算法及新提出的算法,还涉及大语言模型应用中的安全问题等,由复旦大学硕士生符嘉义作为嘉宾,直播时间为2024年12月28日20:00 - 21:00。

🎯大语言模型广泛应用,也带来安全问题

💻讨论当前流行的基于红绿词表的水印算法

🌟介绍基于Gumbel-Max trick的水印算法

🤔从理论角度解释语言模型水印可检测性

和你一起进步的 2024-12-27 12:31 北京

快来预约开播提醒吧~





 AI安全说 第12期 


嘉宾在线解读✔️

在线实时Q&A✔️


 直播主题 


基于解码的语言模型水印研究


 直播嘉宾 


符嘉义

复旦大学知识工厂实验室硕士生


 直播时间 


2024年12月28日(周六)

20:00-21:00


 观看方式 


PaperWeekly视频号

PaperWeekly B站直播间


一键预约直播




 报告介绍 


01

基于解码的语言模型水印研究

近年来,大语言模型的广泛应用极大地提升了工作效率,同时也引发了一些安全问题,例如利用大模型产 生一些虚假内容,在学术考试中的不诚信等等。 


本次报告将讨论当前最流行的大语言模型水印算法——基于红绿词表的算法,同时将这种算法放在一个通用的算法框架下研究,最终介绍笔者所提出的基于 Gumbel-Max trick 的水印算法。


本次报告期望从理论角度解释语言模型水印的可检测性如何得到保证。


 嘉宾介绍 


符嘉义

复旦大学知识工厂实验室硕士生

符嘉义,复旦大学知识工厂实验室硕士生,导师为肖仰华教授。研究方向是大模型安全,水印,以及对齐 技术,已有相关工作发表在 ACL。目前,他的研究兴趣主要集中于大语言模型的对齐技术,以及其中的 reward hacking 现象。




技术交流群

扫码备注「LLM安全」

立刻加入技术交流群


一键预约直播



?


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧


·

·


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

语言模型水印 大语言模型 安全问题 算法研究
相关文章