IT之家 02月12日
BBC 研究:AI 聊天机器人总结新闻错误百出,分不清事实和观点
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

BBC开展研究评估AI聊天机器人在新闻总结方面的表现,结果显示多款AI工具存在大量准确性问题,包括事实错误、无法区分事实与观点等,微软Copilot和谷歌Gemini问题更复杂,BBC呼吁暂停使用AI生成的新闻总结。

🎯多款AI工具参与BBC新闻总结研究,结果不佳

❌AI生成答案超一半有显著问题,五分之一有事实错误

😕AI助手无法区分事实与观点,易掺入主观观点

🤔微软Copilot和谷歌Gemini表现更差,问题较复杂

IT之家 2 月 12 日消息,英国广播公司(BBC)近期开展了一项大规模研究,旨在评估人工智能(AI)聊天机器人在新闻总结方面的表现。研究涉及了微软的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而,研究结果显示,这些工具在生成新闻总结时存在大量准确性问题。

研究中,BBC 让这些 AI 工具对 100 篇新闻报道进行总结,并基于总结提出内容相关问题。结果显示,AI 生成的答案中有超过一半存在“显著问题”其中约五分之一的答案引入了明显的事实错误,这些错误包括数据、陈述和日期等关键信息。BBC 新闻与时事首席执行官德博拉・特内斯(Deborah Turness)指出:“AI 助手在引用 BBC 文章内容时,超过十分之一的‘引文’被篡改或根本不存在于原文中。”

此外,研究还发现,AI 助手在新闻总结时无法区分事实与观点,也无法辨别新闻报道中当下的信息和历史存档的信息,在给出答案的时候还容易掺入主观的观点。特内斯表示:“这些 AI 工具所生成的结果往往是各种问题的混合体,与消费者所期望的经过验证的事实和清晰性相去甚远。”

值得注意的是,BBC 的研究还发现,微软的 Copilot 和谷歌的 Gemini 在处理新闻总结时出现了更复杂的问题,相较于 ChatGPT 和 Perplexity,它们在区分观点与事实、编辑化处理以及遗漏关键背景信息方面表现不佳。

IT之家注意到,AI 工具的准确性问题并非仅限于这些聊天机器人。苹果公司近期也因旗下 Apple Intelligence 通知工具分享错误标题而引发争议,导致其暂时停用该功能,并遭到新闻机构和自由团体的批评。

BBC 呼吁,在与 AI 服务提供商进行深入对话并找到解决方案之前,应暂停使用 AI 生成的新闻总结。特内斯表示:“我们希望通过合作,共同寻找解决办法。”

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI聊天机器人 新闻总结 准确性问题 BBC研究
相关文章