AI & Big Data 5小时前
美國法官判決Anthropic以版權書籍來訓練AI模型屬於合理使用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

2024年8月,作家Andrea Bartz等人代表多位創作者對AI新創Anthropic提起集體訴訟,指控其在訓練語言模型時非法使用盜版電子書。儘管法官裁定AI訓練本身可視為合理使用,但Anthropic儲存未授權書籍的行為可能侵犯著作權,案件將於今年12月進入審判程序。此案揭示了Anthropic自2021年起大規模蒐集盜版電子書的行為,涉及數百萬本未經授權的書籍,引發對生成式AI產業中著作權問題的關注。

📚 原告指控Anthropic在訓練其Claude模型時,大規模使用了未經授權的盜版電子書,侵犯了著作權。這些書籍的來源包括Books3資料集、Library Genesis和Pirate Library Mirror等盜版網站。

⚖️ 法官William Alsup認為,AI訓練本身可視為合理使用,因為其目的與性質是轉化的,AI訓練屬於創造新內容的轉化性用途,且Anthropic模型並未再現原著的創意元素,也未模仿作者風格。

⚠️ 然而,法官同時指出,Anthropic以盜版書籍建立永久資料庫的行為可能構成侵權,需要進行正式審理。若侵權成立,根據美國著作權法,賠償金額可能高達數十億美元。

💡 該裁決被視為生成式AI領域首起針對「AI訓練是否屬於合理使用」作出明確判決的案例,向AI業者示警,未經授權取得受保護作品仍需承擔法律後果。

美國作家Andrea Bartz等人代表多位創作者,2024年8月針對開發Claude模型與聊天機器人的AI新創Anthropic提起集體訴訟,控告其在訓練語言模型時大規模使用來自非法來源的電子書。聯邦法官William Alsup周一(6/23)裁定,雖然AI訓練本身可視為合理使用,但Anthropic儲存未授權書籍的行為可能侵犯著作權,將於今年12月進入審判程序,成為生成式AI產業中關鍵的著作權判例。

控方主張Anthropic大規模使用盜版書籍來訓練AI模型,未取得授權或付費,涉嫌侵犯著作權。

事實上,此一訴訟過程揭露了Anthropic自2021年起便大規模蒐集盜版電子書的行為,包括下載了內含近20萬本電子書的Books3資料集,自著名盜版電子書網站Library Genesis取得逾500萬本書籍,以及從另一個盜版網站Pirate Library Mirror下載200萬本書籍,並將它們存在自家中央圖書館中。

Alsup認為,將書籍內容用以訓練大型語言模型,其目的與性質是轉化的,亦即AI訓練屬於創造新內容的轉化性用途,而非用來取代原作;且Anthropic模型並未向公眾再現原著的創意原素,也沒有模仿任何作者可識別的風格,符合公平使用原則。

然而,Alsup也指出,以所下載的盜版書籍來建立永久的資料庫無法被免責,應該要進行正式審理,以判定是否購成侵權並計算潛在賠償。

依照美國的著作權法,侵權賠償介於750美元至15萬美元之間,就算以最低的750美元來計算,Anthropic存放逾700萬本盜版書籍的賠償費用將是逾50億美元的天價。

總之,此一裁決被視為是生成式AI領域首起針對「AI訓練是否屬於合理使用」作出明確判決的案例,認為大型語言模型屬於高度轉化,另也向AI業者示警,若未經授權取得受保護作品依然得承擔法律後果。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Anthropic 著作權 AI訓練 盜版書籍 合理使用
相关文章