兩美元的帳單:Claude Sonnet 5點燃AI代理價格戰
Anthropic於6月30日推出中價位代理模型Claude Sonnet 5。在「Opus級性能、低價位」的標題背後,我們拆解斷詞器實際支出與三強鼎立的真相。
輸入每百萬token兩美元(約新台幣65元)。Anthropic在6月30日打出的數字,確實便宜。但開發者實際收到的帳單,未必照這個數字算。
Anthropic於2026年6月30日(當地時間)正式推出中價位代理模型 Claude Sonnet 5。它被指定為Free與Pro的預設模型,在Claude Code與API上也能立即使用。官方公布導入價為輸入每百萬token兩美元、輸出10美元(約新台幣325元),限期適用至8月31日。9月1日起調回標準價,輸入3美元、輸出15美元。TechCrunch評此次推出為「讓代理跑得更便宜的方法」。
標題講性能,真正的戰場在單價
發表會表面訊息很清楚:把過去只有頂級模型才做得到的自主代理執行,下放到中價位帶。Anthropic技術團隊成員Zimu Li表示:「Claude Sonnet 5為我們的代理提供了強大的執行層,可處理多步驟的軟體工程任務。」它能自行規劃並操作瀏覽器、終端機等工具,長時間任務也不中途停手,一路跑到完成。
安全性指標也一併公開。Anthropic指出,針對Firefox漏洞開發實際攻擊程式的成功率為 0.0%,意即無法產出可運作的攻擊碼,用以佐證高風險網路能力已受到抑制。
性能數字則要小心解讀。多家媒體引述公開基準指出,Sonnet 5在代理式編碼指標SWE-bench Pro上取得 63.2%。不過Anthropic官方發表文中並無具體數字,僅附上比較圖表,細部數值是媒體讀取圖表與模型卡後轉載的二手資訊。同時也得考量,廠商可能只揭露對自己有利的指標。
名目單價凍結,實際支出是另一回事
多數快訊漏掉的落差正在此處。標準價3美元、15美元,與前代Sonnet 4.6 完全相同,名目上並無漲價。問題在於,計算token的方式變了。
分析媒體指出,Sonnet 5的新斷詞器在處理同一段文字時,會多產生約30%的token。而收費是按token數量計算的。就算單價相同,同一段提示詞被算入的token變多,月底帳單總額仍可能上升。這正是「名目價格凍結」不等於「實際成本凍結」的原因。這種膨脹在中文、日文等非英語文字上往往更明顯——對繁體中文開發者而言,實測比看價目表更重要。
<p>看帳單,別看價目表</p>
<p>對開發者而言,這次發表的真正戰場不是「兩美元」這個數字,而是新斷詞器讓同一段提示詞多算約30%的token。就算名目單價與前代相同,實際支出仍可能增加。判斷依據不該是廠商的價目表,而是把自己真實的提示詞丟進兩邊模型後,跑出來的美元總額。</p>
「三強鼎立」的錯覺
描繪競爭格局時,狀態的區分同樣關鍵。Sonnet 5是此刻真的能用的正式版本。反觀常被一起提及的兩個對手,處境卻不同。
OpenAI的 GPT-5.6 Sol 雖於6月26日亮相,卻仍是預覽階段,僅約20個組織與美國政府等有限夥伴能接觸,正式上市時間僅止於預告。其最高階層級價格據傳約為輸入5美元、輸出30美元。Google的 Gemini 3.5 Pro 則尚未出貨。6月29日僅傳出「7月上市獲准」的階段性消息,價格也未定案。目前Google真正上市的對手,是5月19日亮相的 Gemini 3.5 Flash。基準比較表上常出現的Google模型,也多半不是尚未出貨的3.5 Pro,而是早已問世的既有旗艦 Gemini 3.1 Pro。
換言之,「Sonnet 5對GPT-5.6對Gemini 3.5 Pro」這套三強框架,有一半是預告與預覽。此刻開發者能實際部署上線的中低價位選項,範圍其實收斂到Sonnet 5與Gemini 3.5 Flash。
成本崩壞論 vs 悄悄漲價論
解讀這次推出,有兩種針鋒相對的視角。
一方是成本崩壞論。當Opus級的自主代理性能下放到中價位帶,企業與新創的代理營運單價便會結構性下滑。把代理大量部署、而非少數精銳運用的藍圖,開始成真。Sonnet 5同時在Google Cloud的企業平台上供應,這點被視為進一步降低採用摩擦的訊號。
另一方則提出三點反駁。第一,前述的斷詞器膨脹,反而可能推高實際支出。第二,以公開基準SWE-bench Pro來看,Sonnet 5(63.2%)仍落後頂級的Opus 4.8(69.2%)約6個百分點——最高難度任務,終究還是需要更貴的頂級模型。第三是利潤壓力。中國國產編碼模型生態圈,正推出相容於Anthropic API協定、價格僅約原價七分之一的方案,把價格底線一路往下拉。低價競爭越激烈,前沿實驗室的獲利能力也一併被壓縮。
<p>性能升、價格降的超級循環</p>
<p>Sonnet 5的導入價下調,與其說是一次性促銷,不如說更像是一個訊號:2026年前沿競爭的主軸,正從「能力」轉向「單價與可靠度」。當只有頂級模型才做得到的自主代理,僅隔一個世代就下放到中價位帶、且反覆如此,企業的提問便會從「這個模型行不行」變成「同一個任務,花多少錢能跑完」。</p>
台灣與華語圈,算盤打法不同
不同地區,計算機的刻度不一樣。
在台灣,意涵相當清楚。不少新創沒有自研模型,靠呼叫GPT、Claude的API來組建服務,中價位模型的實效單價會直接牽動損益。對相依於雲端API的開發團隊而言,這類「Opus級、低價位」模型越多,成本試算就越吃緊,也讓自建與外購之間的取捨重新洗牌。此外,台灣硬體供應鏈——從台積電到聯發科——正押注邊緣端AI推論,模型單價下探同時也在重塑「上雲還是落地」的成本邊界。
華語圈的軸線則截然不同。台灣屬於官方支援地區,開發者可把Sonnet 5當成正式選項使用。至於中國大陸,在Anthropic的存取限制脈絡下,這是一款「發表了卻未必能用」的模型,這塊空缺正由阿里巴巴Qwen3-Coder、智譜GLM、DeepSeek等國產替代方案快速填補。在那裡,展開的不是價格戰,而是存取權與國產化的軸線。(此處僅為事實陳述,不涉政治立場判斷。)
未解的問題
Sonnet 5把代理性能的下限往上抬了一級。然而,標題單價與實際帳單之間的距離、最高難度任務對頂級模型的依賴、國產與開源替代方案的追趕速度,都原封不動地留了下來。「以低價位換取Opus級性能」這句話在各自的環境裡是真是假,終究得把自己的提示詞丟進去、確認總額才會知道。價目表只是起點,不是帳單。
本內容由AI根據原文進行摘要和分析。我們力求準確,但可能存在錯誤,建議核實原文。
相關文章
Anthropic發布Opus 4.8,距上一版本僅41天。核心賣點不是更高分數,而是主動標記不確定性的能力。這個設計選擇,正在重新定義企業AI的信任標準。
開源框架Starlette驚爆重大漏洞,影響全球數百萬AI代理伺服器。MCP協議的認證憑證面臨竊取風險,企業與開發者應如何因應?深度分析。
Anthropic的AI編程工具Claude Code與開源專案OpenClaw,正在重塑軟體開發的邊界。這場由少數技術狂熱者引發的變革,將如何影響華人科技產業與亞洲市場?
Google正在打造一個AI代替用戶主動搜尋的世界。當搜尋行為本身消失,資訊取得的主導權將落在誰手中?這對華人世界的科技生態與資訊環境意味著什麼?
觀點
分享您對這篇文章的看法
登入加入討論