Anthropic被作家告了,違規下載700萬本書,15億美元和解了

Anthropic被作家告了,違規下載700萬本書,15億美元和解了

文章圖片

Anthropic被作家告了,違規下載700萬本書,15億美元和解了

文章圖片

Anthropic被作家告了,違規下載700萬本書,15億美元和解了

文章圖片

Anthropic被作家告了,違規下載700萬本書,15億美元和解了

文章圖片


機器之心報道
機器之心編輯部
最新消息 , AI 初創公司 Anthropic 同意支付至少 15 億美元 , 來和解一起作家集體訴訟案件 。 此前 , 這些作家聯合指控 Anthropic 盜版了他們的作品來訓練其聊天機器人 Claude 。
在業界看來 , 如果該協議獲得批準 , 那么這將是一起具有里程碑意義的和解協議 , 是美國版權案件歷史上金額最高的賠償 , 也將是 AI 公司與指控其侵犯版權的作家、視覺藝術家 , 以及其他相關創意專業人士之間法律糾紛的轉折點 。
據了解 , 15 億美元和解金背后涉及的作品約為 50 萬本書 , 平攤下來 , 每本書或每部作品預計獲得 3000 美元的賠償 。 另外 , 作為和解協議的一部分 , Anthropic 也同意銷毀其下載的原始文件及所有副本 。
根據 6 月份的一份裁決顯示 , Anthropic 通過各種渠道 , 從 Library Genesis 和 Pirate Library Mirror 等盜版網站下載了超過 700 萬本「明知是盜版」的電子版書籍 。
所以 , 上個月的時候 , 美國作家協會預計每本書或每部作品的賠償金至少為 750 美元 , 但現在是 3000 美元 , 大概率是在刪除了重復作品和無版權作品后 , 受影響的書籍數量變少了 。
從時間來看 , 這起訴訟案件持續一年之久了 。 去年 8 月 , 以安德里亞?巴茨 (Andrea Bartz)、查爾斯?格雷伯 (Charles Graeber) 和柯克?華萊士?約翰遜 (Kirk Wallace Johnson) 三位作家為代表的一群作家共同對 Anthropic 發起起訴 , 指控 Anthropic 盜版了他們作品來訓練 Claude 。
其實大模型技術一路發展以來 , 有關 AI 公司已經接到過很多類似侵權起訴 , 比如首當其沖的 OpenAI , 而且隨著相互之間的「博弈」 , 關于用何種數據來訓練模型是可以的 , 探討的空間也在一直變化 。 但這是 Anthropic 第一次接到訴訟 。
后來 Anthropic 發現:用受版權保護的作品訓練 AI , 使聊天機器人能夠自己創作文本段落 , 這在美國版權法下符合「合理使用」的條件 , 因為它「本質上具有變革性」 。 所以 Anthropic 也曾以此為理由進行辯解 。
但沒用 , 關鍵在于 Anthropic 用的不是「受版權保護的作品」 , 用的是盜版啊 , Anthropic 理由根本站不住腳 。
針對這次和解 , 美國作家協會首席執行官瑪麗?拉森伯格認為這起到了一個積極作用 , 「對作家、出版商和版權所有者來說都是一個很好的結果 , 它向 AI 行業發出了一個強烈的信號:盜版作者的作品來訓練他們的 AI 將會產生嚴重后果 , 而那些最無力承擔版權的人將因此蒙受損失 。 」
但也有觀點認為 , 這次和解的背后 , 似乎 Anthropic 并沒有「因此蒙受損失」 , 相較于說這是作家的勝利 , 更像是科技公司的再一次勝利 。
因為看似 15 億美元是一筆不菲的金額 , 但平攤下來 , 每部作品獲得的賠償數目并不是很高 。
更關鍵的是 , 這筆賠償金額對 Anthropic 來說 , 不過「灑灑水」而已 。 要知道 , 就在前幾天 , Anthropic 剛剛完成新一輪高達 130 億美元的融資 , 估值高達 1830 億美元 , 今年 8 月的時候該公司的年度化營收就已超過 50 億美元 。
而對于 Anthropic 這次的和解行為 , 其實也符合科技行業的發展慣例 , 即先發展業務 , 然后因違反規則而支付與業務規模相比相對較小的罰款……
有意思的是 , 就在 Anthropic 同意花錢解決侵權問題的同時 , 也有兩則起訴 AI 廠商侵權行為的消息傳出 。 一個是蘋果因使用書籍進行 AI 訓練遭作者起訴 , 另一個是華納兄弟起訴 Midjourney 侵犯超人、蝙蝠俠、神奇女俠、兔八哥、史酷比、飛天小女警、瑞克與莫蒂以及其他角色的 AI 圖像 。

左圖為 Midjourney 輸出的瑞克與莫蒂圖像 , 右圖為原始影片截圖 , 圖源:Hollywood Reporter
而在今年 6 月 , 迪士尼和環球影業也曾聯手起訴了 Midjourney 。 他們認為 , 這家 AI 公司是抄襲其電影和電視節目的「搭便車者」 。
網友討論
Anthropic 的這一做法 , 引起了廣大網友的激烈討論 。
有人認為:Anthropic 并不承認有罪 , 只是達成了一項和解 , 該和解并未確立 AI 訓練一定屬于合理使用(fair use) , 也未確認掃描書籍就是合法的 。 這些核心法律問題 , 仍將留待其他案件去爭論與裁決 。


正是這種模糊不清的裁決 , 甚至有人認為這個案件對生成式人工智能公司來說是一個巨大的勝利 。

這意味著購買了紙質書的人可以自己掃描 , 并用這些內容來訓練模型 。 人們常說 , 大模型已經在整個(公開的)互聯網上完成了訓練 , 但實際上 , 紙質書籍仍然蘊含著大量寶貴的知識 。 而且 , 那些價格低廉、甚至無人問津的二手書 , 可以進行破壞性掃描:把書脊切掉 , 然后放進自動送紙掃描儀逐頁掃描 。 目前網上甚至有提供這種掃描服務的公司 , 專門幫助用戶把紙質書轉成電子版 。

但有網友認為這種做法會對原書造成不可逆的破壞 。 切掉書脊后 , 一頁一頁的紙張會變成垃圾 , 造成巨大浪費 , 不幸的是 , Anthropic 很可能采用了這種做法 。

這不禁讓人聯想到《紐約時報》于 2023 年起訴 OpenAI 及其合作方微軟 , 稱其未經授權使用數百萬篇文章訓練 ChatGPT 和 Copilot 等大型語言模型 。
如果參考 Anthropic 這個案例 , 基本上現在已有先例表明 , 用文本訓練 AI 模型并使其產生輸出并不構成版權侵權 。

雖說 Anthropic 并未承認侵權 , 但依然選擇支付巨額賠償來了結糾紛 。 該公司剛剛完成 130 億美元 F 輪融資 , 這也讓他們具備了足夠的財務能力來買單這起史上最大規模的版權和解案 。 接下來 , 外界的目光將轉向 OpenAI、谷歌等其他巨頭 , 在這之后 , 他們可能會支付更多的費用 。

對此 , 你怎么看?AI 公司的這些操作算是「合理使用」嗎?
參考鏈接:
https://news.ycombinator.com/item?id=45142885
https://www.bloomberg.com/news/articles/2025-09-05/anthropic-to-pay-1-5-billion-to-settle-author-copyright-claims
【Anthropic被作家告了,違規下載700萬本書,15億美元和解了】https://www.hollywoodreporter.com/business/business-news/warner-bros-discovery-sues-ai-company-copyright-infringement-1236361610/

    推薦閱讀