IT之家 04月22日 12:33
OpenAI o3 / o4-mini 模型 AI 生成文本含特殊符号,推测为隐形水印
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AI初创公司Rumi发现OpenAI公司在某些模型中嵌入特殊Unicode字符,这些字符在特定工具中可检测,Rumi推测其可能是故意设置的水印,也可能是模型习得的习惯,行业内其他公司也有类似内容溯源举措,但水印技术存在易受攻击的问题。

🎈Rumi发现OpenAI在o3和o4-mini模型中嵌入特殊Unicode字符

💡这些字符在专业工具中可检测,推测可能是故意设置的水印

📝另一种解释是字符符合排版规则,可能是模型从训练数据中学到的

🌐行业内其他公司也重视内容溯源,水印技术易受攻击

IT之家 4 月 22 日消息,AI 初创公司 Rumi 发现 OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不换行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字符。

IT之家注:这些字符在普通视图中与标准空格无异,但在 SoSciSurvey 或 Sublime Text 等专业工具中,可检测其独特代码。

Rumi 表示在 GPT-4o 等 OpenAI 此前模型中,并不存在这些设置,这些选项可以通过简单的“查找替换”移除,推测这可能是 OpenAI 故意设置的水印。

Rumi 强调,这种字符检测方法误报率极低,但易被绕过的缺陷明显。另一种解释是,这些字符符合排版规则,用于防止货币符号与金额或姓名缩写间换行,可能是模型从训练数据中习得的习惯。

OpenAI 此前曾探索过多种水印方案,例如在 2024 年初为 DALL・E 3 图像添加 C2PA 元数据,以及 2025 年 4 月在 GPT-4o 模型上测试可见的“ImageGen”标签。

行业内,谷歌的 SynthID、微软的元数据嵌入和 Meta 的强制标签也反映出对内容溯源的重视,但研究显示许多水印技术易受攻击。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI 特殊字符 水印技术 内容溯源
相关文章