Anthropic 發布 MCP Tool Search 更新,節省 85% Token 消耗並大幅提升 AI 代理人精準度
Anthropic 發布 MCP Tool Search 更新,將 AI 代理人的 Token 消耗降低 85%,並將 Opus 4.5 的準確度提升至 88.1%。深入了解 AI 領域的「按需讀取」革命。
您的 AI 代理人在開始工作前,是否就已經耗盡了大量記憶體?Anthropic 推出的最新更新,正試圖打破這個「暴力架構」的枷鎖。透過引入「按需讀取(Lazy Loading)」機制,AI 代理人的 Token 消耗量大幅縮減了 85%,讓「上下文空間」真正回歸到對話本身。
Anthropic MCP Tool Search:終結 AI 的「啟動稅」
過去在 Model Context Protocol (MCP) 標準下,AI 代理人如 Claude Code 必須在執行任何任務前,「閱讀」所有可用工具的說明手冊。這種做法導致嚴重的「啟動稅」:在 200,000 個 Token 的限制中,開發者往往尚未輸入任何指令,就已經損失了近三成的配額。
根據 Anthropic 技術成員 Thariq Shihipar 的觀察,某些 MCP 伺服器包含超過 50 個工具,光是定義這些工具就可能消耗高達 67,000 個 Token。這不僅浪費資源,更會干擾 LLM 的推理能力,造成「大海撈針」的難題。
| 性能指標 | 舊版架構 | Tool Search 新架構 |
|---|---|---|
| Token 消耗量 | 約 134,000 | 約 5,000 |
| Opus 4 準確度 | 49.0% | 74.0% |
| Opus 4.5 準確度 | 79.5% | 88.1% |
借鑒軟體工程:從靜態載入轉向動態檢索
此次更新的核心在於 MCP Tool Search。系統現在會監控上下文使用量,一旦工具描述超過可用空間の 10%,便會自動切換策略。系統不再傾倒原始文件,而是加載輕量化的搜索索引,僅在用戶需要特定功能(如「部署容器」)時,才精準提取相關工具定義。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
Anthropic控告美國防部SCR指定,Google DeepMind與OpenAI逾30名研究員聯署支持。這場法律戰揭示AI治理的核心矛盾,對亞洲科技生態影響深遠。
Anthropic為Claude Code推出AI程式碼審查工具,年化營收突破25億美元。當AI同時承擔「寫程式」與「審程式」兩個角色,企業開發流程將如何重塑?
OpenAI宣布收購AI安全新創Promptfoo,將其技術整合進企業級AI代理人平台。這筆交易揭示的,不只是技術整合,更是AI產業下一輪競爭的核心賭注。
Anthropic因拒絕讓AI用於大規模監控與自主武器,遭美國防部列為供應鏈風險。公司提告反擊,這場官司將重塑AI企業與政府的關係。
观点
分享你对这篇文章的看法
登录加入讨论