Meta用盜版數據訓練AI:「知道」等於「共謀」嗎?
Meta被指控透過種子下載約80TB版權內容訓練AI模型,並援引最高法院裁決試圖免責。這場訴訟將如何重塑全球AI產業的數據使用規則?
如果一家公司明知自己在用盜版內容訓練AI,卻仍然繼續——這算不算犯罪?
80TB的灰色地帶
美國一場正在進行的訴訟,正在迫使法院回答這個問題。原告Entrepreneur Media指控Meta透過BitTorrent網路下載了約80TB的受版權保護內容,用於訓練其AI模型。更關鍵的是,Meta在下載的同時,也將這些文件「做種(seed)」上傳給其他用戶——這意味著Meta不只是盜版內容的接收者,更可能是傳播者。
原告主張的法律概念是「輔助侵權(contributory infringement)」:Meta並非直接侵權,而是在明知行為性質的情況下,促成了他人的侵權行為。這與另一宗由書籍作者提起的集體訴訟Kadrey v. Meta中的「直接散布」指控有所不同——後者需要證明Meta完整下載了某部著作,門檻更高;而輔助侵權只需證明Meta「知道」並「促進」了侵權行為,相對更容易成立。
Meta的反擊:最高法院判決當盾牌
上週,Meta向法院提交了意見書,試圖援引美國最高法院近期的一項裁決為自己解套。該裁決認定,網路服務供應商(ISP)不需為其網路上發生的版權侵權行為承擔責任。Meta的邏輯是:僅憑公司「知道」種子下載的運作方式,不足以認定其構成輔助侵權。
然而,這個類比是否成立,本身就是爭議所在。ISP是被動的基礎設施提供者,而Meta是主動收集數據、構建商業AI產品的科技巨頭。法院是否會接受這種類比,將是本案的核心戰場之一。
為什麼這場訴訟牽動全球科技業
這不只是Meta一家公司的問題。OpenAI、Google、Stability AI等幾乎所有主流AI企業,都面臨類似的版權訴訟。這些案件的判決結果,將直接決定AI訓練數據的「合法邊界」在哪裡。
對於華人世界而言,這場法律戰有幾個值得關注的面向:
第一,台灣與香港的內容產業——出版、音樂、影視等創作者,正密切關注美國判例能否為他們的版權主張提供參考框架。
第二,中國大陸的AI發展路徑存在顯著差異。中國對AI訓練數據的版權規範相對寬鬆,但隨著中國AI企業(如百度、阿里巴巴、字節跳動)加速出海,它們在進入歐美市場時,將不可避免地面對更嚴格的版權審查。
第三,東南亞科技市場正在快速發展本地AI能力,若美國確立嚴格的訓練數據版權標準,將大幅提高這些市場的AI開發成本。
「輔助侵權」的邊界,是AI產業的命運線
輔助侵權的概念在法律上並不新鮮,但將其應用於AI訓練數據,卻打開了前所未有的潘朵拉盒子。
如果「知道種子下載如何運作」就足以構成責任,那麼幾乎所有使用公開網路數據訓練AI的公司,都可能面臨相同的指控。這個標準若成立,AI產業的數據收集模式將面臨根本性的重構——要麼付費授權,要麼承擔法律風險。
但反過來說,若法院支持Meta的立場,允許科技巨頭以「技術中立」為由規避版權責任,創作者的權益保障將更加脆弱,內容產業的商業模式也將受到更深遠的衝擊。
這場訴訟沒有明顯的「好人」與「壞人」,只有不同利益群體之間深刻的結構性張力。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
美國兩地陪審團裁定Meta與YouTube對未成年人造成損害,Section 230保護牆出現裂縫。這場訴訟將如何影響亞洲科技市場與華人社群的數位生活?
美國聯邦法院裁定,國防部將AI公司Anthropic列入黑名單是違憲報復行為,因其透過媒體批評政府。這場判決對AI產業、言論自由與地緣政治意味著什麼?
洛杉磯法院裁定Meta與YouTube因社群媒體成癮對青少年造成心理傷害,須賠償600萬美元。這場判決將如何重塑全球平台監管格局?
從智慧手錶到新生兒DNA,身體數據監控的邊界正在消失。美國的案例揭示了一個全球性問題:當健康數據成為證據,誰來保護我們的身體自主權?
观点
分享你对这篇文章的看法
登录加入讨论