AI & Big Data 6小时前
高品質專家標註新法讓LLM訓練資料需求降至萬分之一
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Google Ads发布了一项创新的数据筛选与专家标注流程,旨在大幅缩减大型语言模型(LLM)在广告安全领域微调所需的训练数据量,同时保持甚至提升模型性能。该方法巧妙结合了主动式学习与专家标注,精准挑选最具判断价值的样本,特别适用于政策频繁变动、正类比例极低且需要深度语境理解的分类任务,如识别点击诱饵或违规广告。通过识别模型易混淆的边界样本并由专家审核,该流程能以极少量高质量数据实现模型与专家一致性的大幅提升,有效降低成本并加快模型适应性。

🎯 **高效数据筛选与专家标注流程**:Google Ads推出新流程,通过主动学习与专家标注,将LLM微调所需训练数据量缩减至万分之一,同时维持或提升模型质量。此方法特别适用于广告安全等复杂分类任务,能精准应对政策变化和低正类比例的挑战。

🔀 **识别混淆边界,优化标注效率**:该流程从LLM对广告进行初步分类开始,重点关注模型容易混淆的正负类交集区域。通过选取这些边界样本对交由人类专家审阅,确保了标注数据的最大信息价值和多样性,从而实现高效的微调。

📊 **科学评估与迭代优化模型**:标注后的数据被分为评估集和微调集。评估阶段利用Cohen's Kappa统计量衡量模型与专家的一致性,尤其适用于广告安全等争议性任务。整个过程持续迭代,直至模型与专家的一致性达到平台期或接近专家内部一致性。

📈 **实验验证与显著成效**:在对不同规模模型的实验中,该新流程仅使用少量专家标注数据(250-450条),便使模型与专家的一致性提升了55%-65%,且在高复杂任务中表现尤为突出。即使数据量减少数千倍,模型分类质量仍能与传统方法持平甚至超越。

💡 **LLM与专家协同的优势**:研究结果强调,结合LLM的广泛覆盖能力与专家在复杂样本上的精准判断,是应对广告安全等快速变化场景的有效策略。这不仅降低了数据收集和训练成本,还能在政策或内容模式改变时快速调整模型,保持领先。

Google Ads新發表一套資料篩選與專家標註流程,針對大型語言模型在廣告安全領域的應用,能在維持甚至提升模型品質的同時,將微調所需的訓練資料量縮減至原本的萬分之一。此方法結合主動式學習與專家標註,專注挑選最具判斷價值的樣本,特別適合處理政策規範變化頻繁、正類比例(Positive Rate)極低且需深度語境理解的分類任務,例如偵測點擊誘餌或違規廣告內容。

整個流程從零或少樣本的初始模型LLM-0開始,透過提示對大量廣告自動分類為可疑或正常。由於真實流量中正類,也就是違規或不安全內容比例通常不到1%,且初始模型的真正率有限,研究團隊會先將正、負類資料分類,再找出兩者重疊的交集,這些區域正是模型最容易混淆的判斷邊界。

系統會從中選取距離最近但標籤不同的樣本對,交由兩位人類專家進行審核,確保資料同時具備高度資訊價值與多樣性。

標註後的資料分為評估資料集與微調資料集,前者用於衡量模型與專家的一致性,後者用於進一步微調模型。評估階段採用Cohen's Kappa統計量,衡量針對定性項目標註的一致性與評分者間信度,不依賴唯一正確的基準真相標籤,適用於廣告安全、詐騙偵測等本質上具爭議性的分類任務。整個過程反覆進行,直到模型與專家的一致性接近專家彼此的內部一致性,或進入無法再提升的平臺期。

在實驗中,Google以兩款不同規模的模型,分別是18億與32.5億參數在低與高複雜度任務上進行測試,並與使用10萬筆群眾外包標註資料的傳統基準相比。

結果顯示,對於32.5億參數模型,新流程在僅使用250至450筆專家標註資料的情況下,能將模型與專家的一致性提升55%至65%,且在高複雜度任務中也有明顯改善。即使資料量減少三至四個數量級,模型的分類品質仍與基準持平甚至更佳。

研究團隊指出,要穩定優於群眾外包標註,標註品質需達Cohen's Kappa 0.8以上。這項成果顯示,結合大型語言模型的大範圍涵蓋能力與專家在困難樣本上的精準判斷,可以更有效應對廣告安全等快速變動的場景,降低資料蒐集與訓練成本,並在政策或內容型態變化時迅速調整模型。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Google Ads 大型语言模型 广告安全 主动学习 专家标注
相关文章