AI強大到不能公開：Anthropic的矛盾抉擇

Anthropic開發的AI模型Claude Mythos Preview能找出幾乎所有軟體的安全漏洞，強大到只能限制公開。這場「以AI防AI」的賽局，對華人世界意味著什麼？

一個AI模型，強大到連開發它的公司都不敢公開——這不是科幻小說的情節，而是2026年4月正在發生的事。

「太危險，不能給所有人用」

Anthropic，這家由前OpenAI研究員創立、以「負責任AI」為核心理念的公司，本月初宣布了一個罕見的決定：其最新AI模型「Claude Mythos Preview」暫不對外公開，僅限少數機構使用。

原因出乎意料地直白。Claude Mythos Preview原本是作為通用AI模型開發的，但在內部測試過程中，研究團隊發現它具備一種未曾預料的能力——它能夠精準識別幾乎所有主流作業系統與軟體中的高風險安全漏洞。

換句話說，這個模型掌握了一份「所有數位城牆的裂縫清單」。

目前，Anthropic透過名為「Project Glasswing」的計畫，將這項技術限定提供給Nvidia、Google、JP Morgan Chase等數十家關鍵基礎設施企業。使用方式相當直接：企業向模型提問「我的系統有哪些漏洞？」，AI便會輸出詳細分析，企業再據此修補缺口。但這也意味著，若同樣的問題由惡意駭客提出，得到的答案將成為攻擊的藍圖。

為什麼是現在？

Anthropic選擇此時公開這項計畫，背後有明確的時間壓力。該公司預估，全球其他實驗室可能在未來3至12個月內發布類似技術，OpenAI據報也在開發相近工具。

邏輯因此變得清晰：與其等待類似技術在不受控的情況下擴散，不如先讓最容易成為攻擊目標的關鍵機構提前修補漏洞。The Verge資深AI記者Hayden Field將此比喻為「中世紀的城堡備戰」——知道戰爭即將來臨，所以現在就加固城牆。

廣告合作

[email protected]

這場賽局的背景是：AI輔助的網路攻擊在過去一年已顯著升級。以AI對抗AI，正在從選項變成必要。

華人世界的視角：不對稱的賽局

從華人世界的角度來看，這則新聞有幾個值得深思的層面。

首先是誰在桌上，誰不在的問題。Project Glasswing的參與名單，目前幾乎清一色是美國企業。台灣的台積電、聯發科，香港的金融機構，東南亞的數位銀行——這些同樣是全球數位基礎設施的關鍵節點，卻顯然不在第一波受邀名單之中。當漏洞修補的時間窗口向特定企業開放時，其他企業的相對脆弱性便在無形中上升。

其次是地緣政治的維度。Anthropic表示也向政府提供了這項技術，但並未說明是哪些政府、以何種條件提供。在中美科技競爭持續白熱化的背景下，「誰能使用這項技術」本身就是一個地緣政治問題。中國大陸的科技企業與研究機構，幾乎可以確定不在受邀之列；但這並不意味著類似能力不會在其他途徑下發展出來。

第三是企業與消費者之間的資訊不對稱。對於使用這些平台的普通用戶而言，自己的資料與交易紀錄是否在AI診斷過程中被涉及，目前幾乎沒有任何透明度可言。

「不公開」也是一種選擇——但能維持多久？

Anthropic的做法代表了一種中間路線：既不完全封鎖，也不全面開放。這在商業邏輯與安全考量之間尋求平衡，但批評者會問：由一家私人企業決定「誰值得信任、誰可以使用」，這樣的權力是否應該由更廣泛的社會機制來監督？

更深層的問題在於，這種「限制公開」的窗口期究竟能維持多久。Anthropic自己也承認，類似技術的擴散只是時間問題。當那一天到來，沒有提前修補漏洞的系統將面臨什麼？

對於亞洲的企業與政府而言，這或許是一個訊號：不能等待被邀請，而需要主動建立自身的AI安全能力。

「太危險，不能給所有人用」

為什麼是現在？

華人世界的視角：不對稱的賽局

「不公開」也是一種選擇——但能維持多久？

觀點

記者

相關文章