Cnbeta 02月08日
泄露的电子邮件显示Meta为AI训练下载了数TB的盗版电子书
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Meta被指控在盗版电子书和文章数据集上训练AI模型,未公开邮件提供新证据。作者称Meta非法下载大量盗版数据,公司员工意识到法律风险,而Meta试图隐藏相关活动。

📕Meta被指控在盗版书籍上非法训练AI模型

📄邮件显示Meta下载有争议的大型数据集

💻Meta员工意识到行为的法律风险但公司试图隐藏

🚫Meta试图通过多种方式规避风险

今年 1 月,一项诉讼指控 Meta 在盗版电子书和文章数据集上训练其人工智能模型。 在图书作者提起的版权诉讼案中,这些未公开的电子邮件提供了不利于 Meta 的新证据。 这些作者指控 Meta 在盗版书籍上非法训练其人工智能模型,现在泄露的通信进一步证实了这一指控。

邮件显示,Meta 公司承认下载了一个有争议的大型数据集 LibGen,其中包括数千万本盗版书籍。 根据作者提交的法庭文件,Meta 通过 Anna's Archive 网站从多个影子图书馆下载了至少 81.7 TB 的数据,其中包括来自 Z-Library 和 LibGen 的至少 35.7 TB 的数据。 此外,该公司此前还从 LibGen 下载了 80.6 TB 的数据。

作者形容 Meta 公司的非法转录计划规模惊人,并指出"规模较小的数据盗版行为--仅为 Meta 盗版版权作品数量的 0.008%--都导致法官将该行为移交美国检察官办公室进行刑事调查"。

邮件显示,Meta 公司员工也意识到其行为的法律风险。 2023 年 4 月,Meta 公司的研究工程师尼古拉-巴什利科夫写道:"用公司的笔记本电脑下BT感觉不妥。"

到 2023 年 9 月,巴什科夫加大了抗议力度,并咨询了法律团队。 他写道:"使用 Torrents 意味着对文件进行'播种',即对外共享内容。 这在法律上是不允许的,"他写道。

尽管有这些警告,但作者认为,Meta 公司决定隐藏其播种活动,编辑设置以便尽可能减少播种。 据称,该公司还试图通过将数据集下载到非 Meta 服务器来避免任何人能够从 Meta 服务器"追溯播种者/下载者"的风险。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Meta 盗版数据 AI模型 法律风险
相关文章