大英百科全書告OpenAI:誰擁有人類的知識?
大英百科全書與韋氏辭典控告OpenAI未經授權使用其著作訓練AI,並指GPT-4能逐字輸出其內容。這場訴訟將如何重塑AI產業的遊戲規則?對華人世界意味著什麼?
如果一個AI能夠一字不差地背出大英百科全書的內容,這算是「學習」,還是「抄襲」?
2026年3月14日,擁有逾250年歷史的大英百科全書(Encyclopedia Britannica)與美國權威辭典出版商韋氏辭典(Merriam-Webster)聯手向OpenAI提起著作權侵權訴訟。訴狀指控,OpenAI不僅未經授權擅自使用兩家機構的版權內容訓練AI模型,更嚴重的是——GPT-4已「記住」大量大英百科全書的內容,並能「按需輸出幾乎一字不差的大段複製」。這不只是一場出版商與科技公司之間的商業糾紛,而是一個關於「知識所有權」的根本性追問。
訴訟的核心:「記憶」本身就是侵權?
這場訴訟的法律邏輯分為兩層,值得仔細拆解。
第一層是訓練階段的侵權:OpenAI在未取得授權、未支付報酬的情況下,大規模抓取並使用了受版權保護的內容作為訓練數據。這一指控並不新鮮,紐約時報、多位知名作家此前已提出類似控訴。
第二層則更具挑戰性——輸出階段的持續侵權:訴狀主張,GPT-4在回應用戶提問時,能夠輸出與大英百科全書原文「幾乎一致」的內容。這意味著侵權行為並非只發生在訓練時,而是每一次用戶與AI互動時都可能在持續發生。
大英百科全書創立於1768年,歷經印刷時代、網路衝擊,已是一家在數位轉型中艱難求存的知識機構。韋氏辭典則自1831年起持續記錄英語演變。兩家機構的共同立場是:他們花費數十年、投入大量人力與資金積累的知識資產,被AI公司當作「免費燃料」消耗殆盡。
為何此刻這場訴訟格外關鍵
時機至關重要。目前,美國國會正在討論AI著作權相關立法框架,法院的判決走向將直接影響立法方向。與此同時,OpenAI雖已與部分媒體簽署授權協議(包括美聯社、金融時報等),但此次訴訟揭示的問題遠超個別談判所能解決的範疇——它觸及的是整個AI產業的數據來源合法性。
對華人世界而言,這場訴訟的意義是多維的。
在台灣,聯合報、天下雜誌等媒體機構同樣面臨內容被AI爬取的風險,但本地法律框架尚不明確。在香港,普通法體系使其對美國法院判決的參考價值更高。在東南亞的華人社群,本地語言內容的版權保護更是幾乎處於灰色地帶。
更值得關注的是與中國大陸的對比:中國已對境內AI模型實施《生成式人工智能服務管理暫行辦法》,要求訓練數據合規,但執行標準與美國截然不同。當全球AI公司在不同法律體系間穿梭時,「知識所有權」的邊界將愈加模糊。
多方視角:這場仗,誰在乎?
從科技公司的角度,OpenAI的辯護邏輯可能是:AI學習文本如同人類閱讀書籍,本質上是一種「理解」而非「複製」。況且,若每一筆訓練數據都需付費授權,大型語言模型的開發成本將呈指數級攀升,最終受損的可能是整個AI生態的創新速度。
從內容產業的角度,問題則直指商業模式的存亡。知識機構靠什麼維持運營?如果AI能免費「消化」並「再現」其內容,訂閱制、廣告制的商業邏輯將徹底瓦解。這對本已在數位化浪潮中掙扎的傳統媒體與出版業,無疑是雪上加霜。
從政策制定者的視角,這場訴訟的結果可能形成「贏者通吃」的格局——若法院裁定訓練數據需嚴格授權,資本最雄厚的AI巨頭反而能率先完成授權談判,進一步鞏固壟斷地位,讓中小型AI新創更難生存。
從文化角度看,「知識」在不同文明中的定位本就不同。西方版權體系強調個人創作的財產權;而在部分東亞文化傳統中,知識的傳播與共享被視為更高的社會價值。這種文化差異,將使全球統一的AI著作權規範更難達成共識。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
OpenAI與美國五角大廈簽署機密環境AI使用協議,生成式AI首次被用於伊朗軍事行動的目標優先排序。這對中美科技競爭與亞洲地緣政治意味著什麼?
OpenAI即將為ChatGPT推出成人內容功能,初期僅限文字。誰來定義AI生成內容的邊界?這對亞洲市場與華人世界意味著什麼?
字節跳動的AI影片生成模型Seedance 2.0在中國爆紅後,因好萊塢版權爭議被迫暫停全球上線。這場風波揭示了AI內容生成與智慧財產權之間的根本張力。
Google完成史上最大收購,以320億美元併購雲端資安新創Wiz。這筆交易背後,折射出AI時代資安產業的重估,以及科技巨頭競爭格局的深層變化。
观点
分享你对这篇文章的看法
登录加入讨论