大英百科全書告OpenAI：誰擁有人類的知識？

大英百科全書與韋氏辭典控告OpenAI未經授權使用其著作訓練AI，並指GPT-4能逐字輸出其內容。這場訴訟將如何重塑AI產業的遊戲規則？對華人世界意味著什麼？

如果一個AI能夠一字不差地背出大英百科全書的內容，這算是「學習」，還是「抄襲」？

2026年3月14日，擁有逾250年歷史的大英百科全書（Encyclopedia Britannica）與美國權威辭典出版商韋氏辭典（Merriam-Webster）聯手向OpenAI提起著作權侵權訴訟。訴狀指控，OpenAI不僅未經授權擅自使用兩家機構的版權內容訓練AI模型，更嚴重的是——GPT-4已「記住」大量大英百科全書的內容，並能「按需輸出幾乎一字不差的大段複製」。這不只是一場出版商與科技公司之間的商業糾紛，而是一個關於「知識所有權」的根本性追問。

訴訟的核心：「記憶」本身就是侵權？

這場訴訟的法律邏輯分為兩層，值得仔細拆解。

第一層是訓練階段的侵權：OpenAI在未取得授權、未支付報酬的情況下，大規模抓取並使用了受版權保護的內容作為訓練數據。這一指控並不新鮮，紐約時報、多位知名作家此前已提出類似控訴。

第二層則更具挑戰性——輸出階段的持續侵權：訴狀主張，GPT-4在回應用戶提問時，能夠輸出與大英百科全書原文「幾乎一致」的內容。這意味著侵權行為並非只發生在訓練時，而是每一次用戶與AI互動時都可能在持續發生。

大英百科全書創立於1768年，歷經印刷時代、網路衝擊，已是一家在數位轉型中艱難求存的知識機構。韋氏辭典則自1831年起持續記錄英語演變。兩家機構的共同立場是：他們花費數十年、投入大量人力與資金積累的知識資產，被AI公司當作「免費燃料」消耗殆盡。

為何此刻這場訴訟格外關鍵

廣告合作

[email protected]

時機至關重要。目前，美國國會正在討論AI著作權相關立法框架，法院的判決走向將直接影響立法方向。與此同時，OpenAI雖已與部分媒體簽署授權協議（包括美聯社、金融時報等），但此次訴訟揭示的問題遠超個別談判所能解決的範疇——它觸及的是整個AI產業的數據來源合法性。

對華人世界而言，這場訴訟的意義是多維的。

在台灣，聯合報、天下雜誌等媒體機構同樣面臨內容被AI爬取的風險，但本地法律框架尚不明確。在香港，普通法體系使其對美國法院判決的參考價值更高。在東南亞的華人社群，本地語言內容的版權保護更是幾乎處於灰色地帶。

更值得關注的是與中國大陸的對比：中國已對境內AI模型實施《生成式人工智能服務管理暫行辦法》，要求訓練數據合規，但執行標準與美國截然不同。當全球AI公司在不同法律體系間穿梭時，「知識所有權」的邊界將愈加模糊。

多方視角：這場仗，誰在乎？

從科技公司的角度，OpenAI的辯護邏輯可能是：AI學習文本如同人類閱讀書籍，本質上是一種「理解」而非「複製」。況且，若每一筆訓練數據都需付費授權，大型語言模型的開發成本將呈指數級攀升，最終受損的可能是整個AI生態的創新速度。

從內容產業的角度，問題則直指商業模式的存亡。知識機構靠什麼維持運營？如果AI能免費「消化」並「再現」其內容，訂閱制、廣告制的商業邏輯將徹底瓦解。這對本已在數位化浪潮中掙扎的傳統媒體與出版業，無疑是雪上加霜。

從政策制定者的視角，這場訴訟的結果可能形成「贏者通吃」的格局——若法院裁定訓練數據需嚴格授權，資本最雄厚的AI巨頭反而能率先完成授權談判，進一步鞏固壟斷地位，讓中小型AI新創更難生存。

從文化角度看，「知識」在不同文明中的定位本就不同。西方版權體系強調個人創作的財產權；而在部分東亞文化傳統中，知識的傳播與共享被視為更高的社會價值。這種文化差異，將使全球統一的AI著作權規範更難達成共識。

訴訟的核心：「記憶」本身就是侵權？

為何此刻這場訴訟格外關鍵

多方視角：這場仗，誰在乎？

觀點

記者

相關文章