Liabooks Home|PRISM News
大英百科全書告OpenAI:誰擁有人類的知識?
科技AI分析

大英百科全書告OpenAI:誰擁有人類的知識?

4分钟阅读Source

大英百科全書與韋氏辭典控告OpenAI未經授權使用其著作訓練AI,並指GPT-4能逐字輸出其內容。這場訴訟將如何重塑AI產業的遊戲規則?對華人世界意味著什麼?

如果一個AI能夠一字不差地背出大英百科全書的內容,這算是「學習」,還是「抄襲」?

2026年3月14日,擁有逾250年歷史的大英百科全書(Encyclopedia Britannica)與美國權威辭典出版商韋氏辭典(Merriam-Webster)聯手向OpenAI提起著作權侵權訴訟。訴狀指控,OpenAI不僅未經授權擅自使用兩家機構的版權內容訓練AI模型,更嚴重的是——GPT-4已「記住」大量大英百科全書的內容,並能「按需輸出幾乎一字不差的大段複製」。這不只是一場出版商與科技公司之間的商業糾紛,而是一個關於「知識所有權」的根本性追問。

訴訟的核心:「記憶」本身就是侵權?

這場訴訟的法律邏輯分為兩層,值得仔細拆解。

第一層是訓練階段的侵權OpenAI在未取得授權、未支付報酬的情況下,大規模抓取並使用了受版權保護的內容作為訓練數據。這一指控並不新鮮,紐約時報、多位知名作家此前已提出類似控訴。

第二層則更具挑戰性——輸出階段的持續侵權:訴狀主張,GPT-4在回應用戶提問時,能夠輸出與大英百科全書原文「幾乎一致」的內容。這意味著侵權行為並非只發生在訓練時,而是每一次用戶與AI互動時都可能在持續發生。

大英百科全書創立於1768年,歷經印刷時代、網路衝擊,已是一家在數位轉型中艱難求存的知識機構。韋氏辭典則自1831年起持續記錄英語演變。兩家機構的共同立場是:他們花費數十年、投入大量人力與資金積累的知識資產,被AI公司當作「免費燃料」消耗殆盡。

為何此刻這場訴訟格外關鍵

PRISM

廣告合作

[email protected]

時機至關重要。目前,美國國會正在討論AI著作權相關立法框架,法院的判決走向將直接影響立法方向。與此同時,OpenAI雖已與部分媒體簽署授權協議(包括美聯社金融時報等),但此次訴訟揭示的問題遠超個別談判所能解決的範疇——它觸及的是整個AI產業的數據來源合法性。

對華人世界而言,這場訴訟的意義是多維的。

台灣聯合報天下雜誌等媒體機構同樣面臨內容被AI爬取的風險,但本地法律框架尚不明確。在香港,普通法體系使其對美國法院判決的參考價值更高。在東南亞的華人社群,本地語言內容的版權保護更是幾乎處於灰色地帶。

更值得關注的是與中國大陸的對比:中國已對境內AI模型實施《生成式人工智能服務管理暫行辦法》,要求訓練數據合規,但執行標準與美國截然不同。當全球AI公司在不同法律體系間穿梭時,「知識所有權」的邊界將愈加模糊。

多方視角:這場仗,誰在乎?

科技公司的角度,OpenAI的辯護邏輯可能是:AI學習文本如同人類閱讀書籍,本質上是一種「理解」而非「複製」。況且,若每一筆訓練數據都需付費授權,大型語言模型的開發成本將呈指數級攀升,最終受損的可能是整個AI生態的創新速度。

內容產業的角度,問題則直指商業模式的存亡。知識機構靠什麼維持運營?如果AI能免費「消化」並「再現」其內容,訂閱制、廣告制的商業邏輯將徹底瓦解。這對本已在數位化浪潮中掙扎的傳統媒體與出版業,無疑是雪上加霜。

政策制定者的視角,這場訴訟的結果可能形成「贏者通吃」的格局——若法院裁定訓練數據需嚴格授權,資本最雄厚的AI巨頭反而能率先完成授權談判,進一步鞏固壟斷地位,讓中小型AI新創更難生存。

文化角度看,「知識」在不同文明中的定位本就不同。西方版權體系強調個人創作的財產權;而在部分東亞文化傳統中,知識的傳播與共享被視為更高的社會價值。這種文化差異,將使全球統一的AI著作權規範更難達成共識。

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

观点

相关文章

PRISM

廣告合作

[email protected]
PRISM

廣告合作

[email protected]