IT之家 2024年12月19日
谷歌新规引担忧:消息称外包人员被迫评估自己不擅长的 Gemini 回复
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌调整Gemini大型语言模型回复的外包评估流程,要求评估员不得因专业知识不足而跳过特定评估任务。此举旨在改进Gemini,但引发了外界对其在敏感领域信息准确性的担忧。此前,评估员若认为问题超出自身专业领域,可选择跳过。新规要求评估员必须评估其理解的部分,并注明知识不足。这可能导致Gemini在医疗保健等高度专业性领域输出偏差,增加不准确信息的风险,或对用户造成误导。

⚠️ 谷歌调整Gemini回复评估流程,要求外包评估员不得因专业知识不足跳过评估任务,引发外界对信息准确性的担忧。

🔬 此前,评估员若觉问题超出自身专业领域,例如心脏病学等,可以选择跳过,但新规取消了此选项。

📝 新规要求评估员评估其理解的部分,并注明知识不足,但此举可能导致专业性极强的领域,如医疗健康,由缺乏相关背景知识的评估员评估,增加Gemini输出不准确信息的风险。

🚑 外界担忧此举可能误导用户,尤其在涉及健康等重要问题时,不准确的信息可能带来严重后果。

IT之家 12 月 19 日消息,据 TechCrunch 报道,谷歌针对其大型语言模型 Gemini 回复的外包评估流程进行了一项调整,引发了外界对其在敏感领域信息准确性的担忧。这项调整要求外包评估员不得再像以往那样,因自身专业知识不足而跳过某些特定的评估任务,这或将导致 Gemini 在医疗保健等高度专业性领域的信息输出出现偏差。

为了改进 Gemini,谷歌与其外包公司日立旗下的 GlobalLogic 合作,由后者雇佣的合同工负责评估人工智能生成的回复,评估标准包括“真实性”等因素。此前,如果评估员认为某个问题超出了自身专业领域,例如一个关于心脏病学的专业问题,而评估员本身并无相关科学背景,他们可以选择“跳过”该回应,从而避免评估针对该提示(prompt)的人工智能回复。

然而,上周 GlobalLogic 宣布了一项来自谷歌的变更:评估员不得再以缺乏专业知识为由跳过任何提示。内部通信显示,此前的指导方针是:“如果您没有评估此提示所需的关键专业知识(例如编码、数学),请跳过此任务。”而新的指导方针则改为:“您不应跳过需要特定领域知识的提示。”取而代之的是,评估员需要“评估您理解的提示部分”,并注明自己缺乏相关领域知识。

这项变更引发了人们对 Gemini 在某些主题上准确性的担忧,因为现在评估员有时需要评估一些他们完全不熟悉的、高度专业的技术性人工智能回复,例如关于罕见疾病的问题。一位合同工在内部通信中表示:“我原以为跳过的目的是通过将其交给更专业的人来提高准确性?”

根据新的指导方针,评估员现在只能在两种情况下跳过提示:一是提示或回复“完全缺失信息”,二是提示包含需要特殊同意书才能评估的有害内容。

这项新规的实施,意味着一些对专业性要求极高的领域,例如医疗健康等,将由缺乏相关背景知识的评估员进行评估,这无疑增加了 Gemini 输出不准确信息的风险。外界担忧,此举可能会对用户造成误导,尤其是在涉及健康等重要问题时,不准确的信息可能会带来严重后果。

截至IT之家发稿时,谷歌尚未回应相关报道。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini 大型语言模型 信息准确性 外包评估 医疗健康
相关文章