报告主题:大语言模型的“特异性特征”

报告日期:03月19日(下周三)10:30-11:30

报告要点:

大型语言模型(LLMs)在生成文本时会展现出独特的风格和模式,即“特异性特征”(idiosyncrasies),这些特征可以用来区分不同的模型。在本次报告中,我们研究了这些特性,并提出了一个简单但具有深远影响的问题:给定一段文本,我们能否准确预测其来源模型。我们的研究表明,通过在LLM生成的文本上微调现有的文本嵌入模型,可以实现极高的分类准确率。例如,在包含ChatGPT、Claude、Grok、Gemini和DeepSeek五种模型的分类任务中,我们的模型在验证集上达到了97.1%的准确率。进一步分析发现,这些特性不仅体现在词汇分布层面,而且在文本被重写、翻译或摘要后仍然保留,说明它们深深嵌入在语义内容之中。我们还借助LLM-as-a-judge,自动生成不同模型的详细特征描述,并讨论这些发现对合成数据训练和模型相似性研究的潜在影响。

报告嘉宾:
孙明杰是卡内基梅隆大学(CMU)计算机科学系的博士生,师从Zico Kolter教授,主要研究大语言模型的效率和安全性。在攻读博士学位期间,他曾在微软研究院(Microsoft Research)和其他顶尖研究机构实习。他的研究曾在NeurIPS Compact Neural Network Workshop获得最佳论文奖Best Paper Award。他在清华大学姚班获得本科学位。

扫码报名

更多热门报告

内容中包含的图片若涉及版权问题,请及时与我们联系删除