AI說「我不確定」，這比說「我知道」更難——Anthropic新模型的信任賭注

Anthropic發布Opus 4.8，距上一版本僅41天。核心賣點不是更高分數，而是主動標記不確定性的能力。這個設計選擇，正在重新定義企業AI的信任標準。

全球最大對沖基金之一的分析師，把一個問題交給AI處理，結果AI主動回報：「這份輸入資料有問題。」這個時刻，比任何基準測試分數都更值得關注。

Anthropic於2026年5月28日正式發布「Claude Opus 4.8」，定價維持與前版相同水準，即日起全面開放API及所有使用渠道。但這次發布真正引發討論的，不是模型的能力上限，而是一個更微妙的問題：AI什麼時候應該說「我不確定」？

41天：這個數字說明了什麼

Anthropic目前旗下主力模型的更新週期，Sonnet約3個月，Haiku約7個月。相比之下，Opus 4.8距離上一版Opus 4.7發布僅41天，這在該公司歷史上幾乎沒有先例。

這個壓縮的時間表，背後有兩條清晰的邏輯線。第一，Opus 4.7上市後口碑不佳，部分用戶明確表示失望，信譽修復的壓力迫在眉睫。第二，在這41天內，OpenAI推出了升級版Codex，Google強化了Gemini Flash——競爭窗口正在以週為單位收窄，而非季度。

Anthropic在發布文章中強調的核心改進，並非跑分領先，而是模型處理「壞資料或不確定資訊」的方式。早期測試者發現，Opus 4.8「更傾向於標記自身工作的不確定性，更不容易提出無根據的主張」。

Bridgewater Associates的使用回饋直接點出差異：「最大的不同在於Opus 4.8會主動標記分析過程中輸入與輸出的問題——這是其他模型長期忽略、只能留給用戶自行發現的事。」

廣告合作

伴隨新模型同步發布的，是名為「Dynamic Workflows」的新功能，目前以研究預覽形式開放。這個系統的設計目標，是讓Opus這類大型模型能夠協調數百個並行子代理，處理跨越整個代碼庫規模的複雜任務。

Anthropic給出的具體場景是：「Claude Code搭配Opus 4.8，現在能夠執行代碼庫級別的遷移工作——從啟動到合併，跨越數十萬行代碼，以現有測試套件作為驗收標準。」

這不只是軟體工程師的工具升級。它所描繪的，是一種新的人機協作模式：人類負責設定目標與驗收標準，AI代理群負責執行與自我校驗。對台灣的科技製造業、香港的金融服務業、以及東南亞快速成長的新創生態而言，這類「可自我監督的AI工作流程」，可能是降低人力成本、提升系統可靠性的關鍵槓桿。

與此同時，Anthropic繼續暫緩發布更強大的「Mythos」模型。上月的限定預覽引發了網路安全方面的顧慮，公司表示正在快速開發必要的防護機制，「預計在未來數週內」向所有用戶開放Mythos級別的模型。

從商業應用的角度看，Opus 4.8的核心賣點觸及了一個長期困擾企業AI部署的根本問題：如何知道AI什麼時候在胡說？

過去幾年，企業AI採用的最大阻力之一，不是模型不夠聰明，而是模型「過於自信」——在資料不足或邏輯存在缺口時，仍然生成流暢、看似合理的答案。這種特性在消費端尚可容忍，但在金融分析、法律審查、醫療輔助等高風險場景中，後果可能嚴重。

如果Opus 4.8確實能夠可靠地「主動標記問題」，它解決的不只是一個技術痛點，而是企業決策者心中一道信任的門檻。這也解釋了為何Bridgewater這類對資料品質極度敏感的機構，會將此視為最重要的升級。

然而，反面的問題同樣存在：AI對「不確定性」的判斷本身，是否可靠？它如何決定哪些問題值得標記、哪些不值得？這個判斷機制的透明度，目前仍然有限。