Hugging Face 2024年12月13日
人工评估 | 人工标注员
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章介绍人工标注质量管理的实践经验,包括选择合适标注员、提供经济激励、设计标注准则、迭代标注、质量检查等方面,还推荐了相关学习资源。

🎯选择合适标注员,考虑人口统计特征,如母语、教育水平等

💪提供经济激励,认为支付合理费用更好

📖深入思考制定标注准则,需花费大量时间

🔄做好多轮迭代标注准备,改进以达需求

🔎进行质量检查和手动筛选,确保答案质量

原创 Hugging Face 2024-12-13 10:31 广东

标注员的选择和管理对人工标注的质量影响很大,我们应该怎么做?

这是 人工评估 系列文章的第二篇《人工标注员》,全系列包括:

推荐阅读这篇综述的第三章,介绍了许多数据标注质量管理的实践经验。如果你追求的是生产级的质量,并且具备实施条件,那么请继续阅读吧!

Analyzing Dataset Annotation Quality Management in the Wildhttps://aclanthology.org/2024.cl-3.1/

Best_annotation_practices

无论项目规模多大,一旦定义了具体的评估任务和打分细则,请注意:

    符合特定的人口统计特征。
    例如:母语是测试目标语言、较高的教育水平、特定领域的专业知识、多样化的地域背景等。根据评估任务不同,对标注员统计特征需求也不一样。

    提供高质量标注。
    有些任务中筛选合适的标注员很重要,比如近期有一种任务是检查回答是否是 LLM 生成的。
    个人认为,除非你众包标注员有强烈的自我驱动意识,否则一般还是支付合理的费用更好。

设计标注准则请务必深入思考制定标注准则,非常值得花费大量时间去做!我们在制作GAIA数据集时的耗时最多的地方就是这里。

迭代标注很多时候标注员会误解标注指南 (他们的想法可能比你想象的更模棱两可),所以要做好多轮迭代标注的准备,来不断改进直到达到你的需求。

质量检查手动筛选你需要仔细检查答案的质量 (检查标注员间的答案一致性),并筛选出质量最优、相关性最高的答案。

你也可以使用专用工具来构建高质量标注数据集,如Argilla

深入阅读推荐链接:

原文链接:https://github.com/huggingface/evaluation-guidebook/blob/main/contents/human-evaluation/using-human-annotators.md

作者: clefourrier

译者: SuSung-boy

审校: adeenayakup

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

人工标注 质量管理 标注准则 迭代标注 质量检查
相关文章