DeepSeek Engram conditional memory 重新定義企業級 AI 算力配置比例

DeepSeek 發表 Engram 技術，透過 DeepSeek Engram conditional memory 分離檢索與推論。實驗顯示 75/25 的算力比例能提升 4% 推論準確度，並大幅優化 GPU 成本。

算力浪費已成過去，AI 效率即將突飛猛進。DeepSeek最新發布的「Engram」技術研究，揭示了如何透過分離靜態檢索與動態推論，在顯著提升性能的同時，大幅降低 GPU 基礎設施的負擔。

DeepSeek Engram conditional memory 如何優化模型架構

目前的企業級 LLM 在檢索產品名稱或技術規格等靜態資訊時，仍需調動昂貴的 GPU 進行複雜推論。這種做法如同「用計算機背電話號碼」，既耗時又耗能。DeepSeek 創辦人梁文鋒（Liang Wenfeng）參與的研究提出了解決方案：Engram 模組。

Engram 引入了「conditional memory（條件式記憶體）」，讓模型具備「原生知識檢索」能力。它利用哈希函數在常數時間內完成檢索，並配合門控機制（Gating mechanism）確保檢索內容符合當前語境。這與儲存對話歷史的代理記憶體（Agentic memory）不同，它優化的是模型內部的語言模式處理。