cnBeta全文版 16小时前
读书破万卷 法庭文件显示Anthropic为训练AI损坏了数百万本实体书籍
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文探讨了生成式人工智能在训练过程中面临的版权问题,特别是Anthropic公司为训练其AI助手而销毁数百万本书籍的案例。文章揭示了AI模型训练对实体书籍的依赖,以及由此引发的版权纠纷。尽管Anthropic在诉讼中胜诉,但其行为引发了对版权保护、合理使用以及AI行业可持续性的深刻思考。文章还提到了其他公司如迪士尼面临的类似挑战,预示着生成式AI行业未来可能面临的版权风险。

📚 Anthropic公司为了训练其AI助手Claude,购买并销毁了数百万本实体书籍,通过撕下和扫描页面进行数字化,最终永久销毁这些书籍。这一行为被法院认为是其胜诉的一个因素,因为数字化和抓取书籍构成了充分的转化,符合合理使用的规定。

⚖️ Anthropic公司胜诉的关键在于,法院认为其行为符合合理使用原则,这使得Anthropic无需通知原出版商或作者即可利用受版权保护的书籍训练AI模型。然而,这引发了对版权保护和AI行业可持续性的争议。

⚠️ 大型语言模型有时会逐字复制训练数据中的内容,这引发了对版权侵权的担忧。同时,AI行业若要遵守版权法,可能面临无法获取足够训练数据的困境,Metal公司前高管曾表示,遵守版权法可能导致AI行业“一夜消亡”。

💰 迪士尼对Midjourney的诉讼表明,版权纠纷对生成式AI生态系统构成重大影响。Anthropic公司仍面临版权审判,可能被要求为每部盗版作品支付高额赔偿金,这凸显了版权问题对AI行业发展的潜在威胁。

生成式人工智能早已因其众所周知的可靠性问题、巨大的能耗以及未经授权使用版权资料而饱受诟病。如今,最近的一起法庭案件揭露,训练这些人工智能模型还涉及大规模销毁实体书籍。

在最近一项针对 Anthropic 的判决中隐藏着一个令人惊讶的细节:这家人工智能生成公司为了训练其人工智能助手,销毁了数百万本实体书籍,包括剪掉装订线并丢弃残骸。值得注意的是,此次销毁行为被认为是法院最终判决 Anthropic 胜诉的一个因素。

为了构建其语言模型和 ChatGPT 竞争对手 Claude,Anthropic 用尽可能多的书籍进行训练。该公司购买了数百万本实体书,并通过撕下和扫描页面进行数字化,在此过程中永久销毁了这些书籍。

此外,Anthropic 并未计划公开发布最终的数字版本。这一细节有助于说服法官,数字化和抓取书籍构成了充分的转化,符合合理使用的规定。虽然 Claude 可能使用数字化图书馆来生成独特的内容,但批评人士指出,大型语言模型有时可以根据其训练数据逐字复制内容。

Anthropic 的部分法律胜利使其能够在无需通知原出版商或作者的情况下,利用受版权保护的书籍训练 AI 模型,这或将消除生成 AI 行业面临的最大障碍之一。Metal 的一位前高管最近承认,如果被要求遵守版权法,AI 将在一夜之间消亡,这可能是因为开发人员将无法访问训练大型语言模型所需的海量数据。

然而,持续不断的版权纠纷仍然对这项技术构成重大威胁。本月早些时候,Getty Images 首席执行官承认,公司无力承担所有与 AI 相关的版权侵权行为的打击。与此同时,迪士尼对 Midjourney 的诉讼——该公司在诉讼中展示了图像生成器复制受版权保护内容的能力——可能会对更广泛的生成 AI 生态系统产生重大影响。

话虽如此,Anthropic案的法官确实判决该公司败诉,因为该公司部分依赖盗版图书库来训练克劳德。Anthropic仍需在12月面临版权审判,届时该公司可能被要求为每部盗版作品支付高达15万美元的赔偿金。

查看评论

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

生成式人工智能 版权 Anthropic AI训练 书籍销毁
相关文章