Liabooks Home|PRISM News
AI強大到不能公開:Anthropic的矛盾抉擇
CultureAI分析

AI強大到不能公開:Anthropic的矛盾抉擇

4分钟阅读Source

Anthropic開發的AI模型Claude Mythos Preview能找出幾乎所有軟體的安全漏洞,強大到只能限制公開。這場「以AI防AI」的賽局,對華人世界意味著什麼?

一個AI模型,強大到連開發它的公司都不敢公開——這不是科幻小說的情節,而是2026年4月正在發生的事。

「太危險,不能給所有人用」

Anthropic,這家由前OpenAI研究員創立、以「負責任AI」為核心理念的公司,本月初宣布了一個罕見的決定:其最新AI模型「Claude Mythos Preview」暫不對外公開,僅限少數機構使用。

原因出乎意料地直白。Claude Mythos Preview原本是作為通用AI模型開發的,但在內部測試過程中,研究團隊發現它具備一種未曾預料的能力——它能夠精準識別幾乎所有主流作業系統與軟體中的高風險安全漏洞。

換句話說,這個模型掌握了一份「所有數位城牆的裂縫清單」。

目前,Anthropic透過名為「Project Glasswing」的計畫,將這項技術限定提供給NvidiaGoogleJP Morgan Chase等數十家關鍵基礎設施企業。使用方式相當直接:企業向模型提問「我的系統有哪些漏洞?」,AI便會輸出詳細分析,企業再據此修補缺口。但這也意味著,若同樣的問題由惡意駭客提出,得到的答案將成為攻擊的藍圖。

為什麼是現在?

Anthropic選擇此時公開這項計畫,背後有明確的時間壓力。該公司預估,全球其他實驗室可能在未來3至12個月內發布類似技術,OpenAI據報也在開發相近工具。

邏輯因此變得清晰:與其等待類似技術在不受控的情況下擴散,不如先讓最容易成為攻擊目標的關鍵機構提前修補漏洞。The Verge資深AI記者Hayden Field將此比喻為「中世紀的城堡備戰」——知道戰爭即將來臨,所以現在就加固城牆。

PRISM

廣告合作

[email protected]

這場賽局的背景是:AI輔助的網路攻擊在過去一年已顯著升級。以AI對抗AI,正在從選項變成必要。

華人世界的視角:不對稱的賽局

從華人世界的角度來看,這則新聞有幾個值得深思的層面。

首先是誰在桌上,誰不在的問題。Project Glasswing的參與名單,目前幾乎清一色是美國企業。台灣的台積電聯發科,香港的金融機構,東南亞的數位銀行——這些同樣是全球數位基礎設施的關鍵節點,卻顯然不在第一波受邀名單之中。當漏洞修補的時間窗口向特定企業開放時,其他企業的相對脆弱性便在無形中上升。

其次是地緣政治的維度Anthropic表示也向政府提供了這項技術,但並未說明是哪些政府、以何種條件提供。在中美科技競爭持續白熱化的背景下,「誰能使用這項技術」本身就是一個地緣政治問題。中國大陸的科技企業與研究機構,幾乎可以確定不在受邀之列;但這並不意味著類似能力不會在其他途徑下發展出來。

第三是企業與消費者之間的資訊不對稱。對於使用這些平台的普通用戶而言,自己的資料與交易紀錄是否在AI診斷過程中被涉及,目前幾乎沒有任何透明度可言。

「不公開」也是一種選擇——但能維持多久?

Anthropic的做法代表了一種中間路線:既不完全封鎖,也不全面開放。這在商業邏輯與安全考量之間尋求平衡,但批評者會問:由一家私人企業決定「誰值得信任、誰可以使用」,這樣的權力是否應該由更廣泛的社會機制來監督?

更深層的問題在於,這種「限制公開」的窗口期究竟能維持多久。Anthropic自己也承認,類似技術的擴散只是時間問題。當那一天到來,沒有提前修補漏洞的系統將面臨什麼?

對於亞洲的企業與政府而言,這或許是一個訊號:不能等待被邀請,而需要主動建立自身的AI安全能力。

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

观点

相关文章

PRISM

廣告合作

[email protected]
PRISM

廣告合作

[email protected]