兩美元的帳單：Claude Sonnet 5點燃AI代理價格戰

Anthropic於6月30日推出中價位代理模型Claude Sonnet 5。在「Opus級性能、低價位」的標題背後，我們拆解斷詞器實際支出與三強鼎立的真相。

輸入每百萬token兩美元（約新台幣65元）。Anthropic在6月30日打出的數字，確實便宜。但開發者實際收到的帳單，未必照這個數字算。

Anthropic於2026年6月30日（當地時間）正式推出中價位代理模型 Claude Sonnet 5。它被指定為Free與Pro的預設模型，在Claude Code與API上也能立即使用。官方公布導入價為輸入每百萬token兩美元、輸出10美元（約新台幣325元），限期適用至8月31日。9月1日起調回標準價，輸入3美元、輸出15美元。TechCrunch評此次推出為「讓代理跑得更便宜的方法」。

標題講性能，真正的戰場在單價

發表會表面訊息很清楚：把過去只有頂級模型才做得到的自主代理執行，下放到中價位帶。Anthropic技術團隊成員Zimu Li表示：「Claude Sonnet 5為我們的代理提供了強大的執行層，可處理多步驟的軟體工程任務。」它能自行規劃並操作瀏覽器、終端機等工具，長時間任務也不中途停手，一路跑到完成。

安全性指標也一併公開。Anthropic指出，針對Firefox漏洞開發實際攻擊程式的成功率為 0.0%，意即無法產出可運作的攻擊碼，用以佐證高風險網路能力已受到抑制。

性能數字則要小心解讀。多家媒體引述公開基準指出，Sonnet 5在代理式編碼指標SWE-bench Pro上取得 63.2%。不過Anthropic官方發表文中並無具體數字，僅附上比較圖表，細部數值是媒體讀取圖表與模型卡後轉載的二手資訊。同時也得考量，廠商可能只揭露對自己有利的指標。

名目單價凍結，實際支出是另一回事

多數快訊漏掉的落差正在此處。標準價3美元、15美元，與前代Sonnet 4.6 完全相同，名目上並無漲價。問題在於，計算token的方式變了。

分析媒體指出，Sonnet 5的新斷詞器在處理同一段文字時，會多產生約30%的token。而收費是按token數量計算的。就算單價相同，同一段提示詞被算入的token變多，月底帳單總額仍可能上升。這正是「名目價格凍結」不等於「實際成本凍結」的原因。這種膨脹在中文、日文等非英語文字上往往更明顯——對繁體中文開發者而言，實測比看價目表更重要。

看帳單，別看價目表

對開發者而言，這次發表的真正戰場不是「兩美元」這個數字，而是新斷詞器讓同一段提示詞多算約30%的token。就算名目單價與前代相同，實際支出仍可能增加。判斷依據不該是廠商的價目表，而是把自己真實的提示詞丟進兩邊模型後，跑出來的美元總額。

「三強鼎立」的錯覺

描繪競爭格局時，狀態的區分同樣關鍵。Sonnet 5是此刻真的能用的正式版本。反觀常被一起提及的兩個對手，處境卻不同。

OpenAI的 GPT-5.6 Sol 雖於6月26日亮相，卻仍是預覽階段，僅約20個組織與美國政府等有限夥伴能接觸，正式上市時間僅止於預告。其最高階層級價格據傳約為輸入5美元、輸出30美元。Google的 Gemini 3.5 Pro 則尚未出貨。6月29日僅傳出「7月上市獲准」的階段性消息，價格也未定案。目前Google真正上市的對手，是5月19日亮相的 Gemini 3.5 Flash。基準比較表上常出現的Google模型，也多半不是尚未出貨的3.5 Pro，而是早已問世的既有旗艦 Gemini 3.1 Pro。

換言之，「Sonnet 5對GPT-5.6對Gemini 3.5 Pro」這套三強框架，有一半是預告與預覽。此刻開發者能實際部署上線的中低價位選項，範圍其實收斂到Sonnet 5與Gemini 3.5 Flash。

成本崩壞論 vs 悄悄漲價論

解讀這次推出，有兩種針鋒相對的視角。

一方是成本崩壞論。當Opus級的自主代理性能下放到中價位帶，企業與新創的代理營運單價便會結構性下滑。把代理大量部署、而非少數精銳運用的藍圖，開始成真。Sonnet 5同時在Google Cloud的企業平台上供應，這點被視為進一步降低採用摩擦的訊號。

另一方則提出三點反駁。第一，前述的斷詞器膨脹，反而可能推高實際支出。第二，以公開基準SWE-bench Pro來看，Sonnet 5（63.2%）仍落後頂級的Opus 4.8（69.2%）約6個百分點——最高難度任務，終究還是需要更貴的頂級模型。第三是利潤壓力。中國國產編碼模型生態圈，正推出相容於Anthropic API協定、價格僅約原價七分之一的方案，把價格底線一路往下拉。低價競爭越激烈，前沿實驗室的獲利能力也一併被壓縮。

性能升、價格降的超級循環

Sonnet 5的導入價下調，與其說是一次性促銷，不如說更像是一個訊號：2026年前沿競爭的主軸，正從「能力」轉向「單價與可靠度」。當只有頂級模型才做得到的自主代理，僅隔一個世代就下放到中價位帶、且反覆如此，企業的提問便會從「這個模型行不行」變成「同一個任務，花多少錢能跑完」。

台灣與華語圈，算盤打法不同

不同地區，計算機的刻度不一樣。

在台灣，意涵相當清楚。不少新創沒有自研模型，靠呼叫GPT、Claude的API來組建服務，中價位模型的實效單價會直接牽動損益。對相依於雲端API的開發團隊而言，這類「Opus級、低價位」模型越多，成本試算就越吃緊，也讓自建與外購之間的取捨重新洗牌。此外，台灣硬體供應鏈——從台積電到聯發科——正押注邊緣端AI推論，模型單價下探同時也在重塑「上雲還是落地」的成本邊界。

華語圈的軸線則截然不同。台灣屬於官方支援地區，開發者可把Sonnet 5當成正式選項使用。至於中國大陸，在Anthropic的存取限制脈絡下，這是一款「發表了卻未必能用」的模型，這塊空缺正由阿里巴巴Qwen3-Coder、智譜GLM、DeepSeek等國產替代方案快速填補。在那裡，展開的不是價格戰，而是存取權與國產化的軸線。（此處僅為事實陳述，不涉政治立場判斷。）