Anthropic AI模型訓練涉盜版書籍 Anthropic與作家15億美元和解案遭法官暫緩批准
作者:楊芝青律師
作家Bartz 等人以集體訴訟方式於美國加州北區地方法院對Anthropic(Claude 開發商)起訴,主張Anthropic將受其著作權法保護的著作當作訓練AI材料構成侵權。2025年上半年,美國加州北區地方法院針對「以受著作權保護之材料訓練AI大語言模型(LLMs)是否侵害著作權抑或合理使用」作出裁決,肯認被告將原告著作納入 LLM 訓練,是高度轉化性的學習行為,且其將合法購買的紙本書掃描成數位檔,以便儲存與搜尋,亦屬合理使用。然而另一方面,則認爲下載並長期保存盜版書籍以建立中央資料庫,並非轉化性使用,且傷害書籍市場,屬惡意行為,因此不構成合理使用。簡言之,法院裁決針對「盜版書籍」相關的侵權責任與賠償進行後續交由陪審團裁決審理;而「訓練用途」與「紙本掃描」合法購買書籍則確認為合理使用,不須賠償。
photo by ChatGPT(封圖、內文)
於陪審團9月8日原本預計針對「盜版書籍」侵權責任部分開庭的前幾天,兩造達成了和解。若經法院批准,此一在AI及著作權法均極具重要性之案件將就此落幕。經公佈的和解條件中,Anthropic 將支付 15 億美元至和解基金,以作爲其 Claude AI 模型在訓練過程中使用約 50 萬本從影子圖書館 Library Genesis(LibGen)或 Pirate Library Mirror(PiLiMi)資料集下載的盜版書籍之賠償金。此外,Anthropic 應銷毀所有前述下載的原始書籍檔案,以及任何由這些盜版檔案衍生出的副本。和解條件並未包含授權未來訓練,且 Anthropic 須聲明其任何商業發布的大型語言模型的訓練資料中,均未包含 LibGen 或 PiLiMi 資料集,亦未使用這些資料集的任何部分。由於本案爲集體訴訟的特性,兩造更約定,Anthropic 若增加作品清單中的項目,導致獨特作品總數超過五十萬(500,000)本,則應就每一部新增作品,額外支付三千美元。由此可見,兩造就每部作品的賠償金設定爲約三千美元。
與此對照,2008年谷歌因爲推行Google Book計畫將世界上所有的書本數位化,遭美國出版商協會(Association of American Publishers)及美國作者協會(Author’s Guild)提告,曾提出1億2千5百萬的和解金。本件 Anthropic提供的和解金爲當年谷歌案的整整12倍。雖然金額極高,對市值約1,380億的 Anthropic而言仍是正面消息。將合法購買的紙本書另行掃描成數位檔及後續用於AI訓練的行爲是否構成合理使用,仍未到終審法院,原告本來仍可透過上訴尋求翻盤,若法院批准兩造和解,原告也無法再上訴追究。換言之,Anthropic此後只要確保合法購入訓練用的著作物,後續如何將資料餵給AI,已非著作權人得以置喙。
然而本件爲集體訴訟,訴訟律師依據和解條件得請求至多25%的律師費,承審法官擔憂律師因自身利益強迫作者接受和解條件,故暫時拒絕批准和解,並請兩造提供個別作者如何受償之細節以供評估,AI與著作權爭議的重要里程碑案件再添變數。