人工智慧公司 Anthropic 已同意支付 15 億美元,以了結一項由作家提起的集體訴訟。該訴訟指控 Anthropic 在訓練其 Claude AI 模型時,非法使用了作者們受版權保護的書籍。此和解協議於 2025 年 9 月 5 日宣布,標誌著 AI 產業在處理訓練數據的版權問題上邁出了重要一步,並為未來類似的法律糾紛設定了先例。
訴訟的核心在於 Anthropic 被指控從未經授權的來源,包括 Library Genesis (LibGen) 和 Pirate Library Mirror (PiLiMi),下載了約 465,000 本書籍,用於訓練其 AI 模型。作家 Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson 等人作為原告,指控此舉侵犯了他們的版權。根據和解協議,Anthropic 將銷毀所有用於訓練的盜版書籍副本,並停止使用未經授權的材料進行未來的 AI 訓練。
此和解金額高達 15 億美元,平均每部作品約 3,000 美元,涵蓋了約 500,000 部作品。這項協議被譽為美國歷史上最大的版權和解案之一,其影響深遠。它不僅為受影響的作者提供了實質性的賠償,也向整個 AI 行業發出了強烈訊息:在獲取訓練數據時,必須遵守版權法規,並尊重創作者的權利。
此案的判決結果對 AI 產業具有關鍵意義。美國聯邦法院在 6 月份的一項裁決中曾指出,在訓練 AI 模型時使用受版權保護的書籍可能構成「轉化性合理使用」,但前提是這些書籍是合法獲取的。然而,對於從盜版網站下載的材料,法院則認為這是「固有且無法挽回的侵權行為」。Anthropic 選擇在此時達成和解,避免了可能導致公司倒閉的巨額潛在賠償,也顯示了其對法律風險的謹慎評估。
此事件凸顯了 AI 技術發展與知識產權保護之間的複雜關係。隨著 AI 技術的飛速發展,如何平衡創新需求與創作者權益成為一個日益嚴峻的挑戰。此類訴訟的結果,例如 Anthropic 的和解案,將促使 AI 公司更加重視數據來源的合法性,並可能推動行業尋求更合規、更具道德的數據獲取方式,例如透過授權協議。這也可能影響未來 AI 的發展速度和成本結構,促使業界尋求更可持續的發展模式,確保技術進步的同時,也能夠公平地回報內容創作者的貢獻。此外,此類案件的判決也可能影響其他類似的訴訟,並促使監管機構對 AI 數據採集實踐進行更嚴格的審查。