Liabooks Home|PRISM News
AI記憶體大戰:DRAM飆漲7倍,快取管理成企業生死關鍵
科技AI分析

AI記憶體大戰:DRAM飆漲7倍,快取管理成企業生死關鍵

3分钟阅读Source

AI基礎設施成本焦點從GPU轉向記憶體。DRAM價格一年內漲7倍,提示快取優化技術將決定AI企業競爭力。記憶體編排成新戰場。

談到AI基礎設施成本,大家都盯著NVIDIA的GPU。但真正在過去一年飆漲7倍的,其實是記憶體晶片。

被忽視的記憶體革命

當超大規模業者準備投入數十億美元建設新資料中心時,DRAM晶片價格在一年內暴漲約7倍。同時,如何編排這些記憶體,確保正確的資料在正確的時間送達正確的代理程式,正成為一門新的學問。

掌握這項技術的公司,將能用更少的令牌完成相同查詢——這可能是倒閉與生存的差別。

半導體分析師Dan O'LaughlinWeka首席AI官Val Bercovici的對談揭示了一個關鍵趨勢:Anthropic的提示快取定價頁面變化,完美詮釋了這個領域的複雜性。

六七個月前,這個頁面非常簡單——「使用快取,更便宜」。現在它變成了一本百科全書,詳細說明該預購多少次快取寫入。你可以選擇5分鐘層級或1小時層級,沒有更長的選項。

快取經濟學的精密計算

Claude讓你選擇快取保存時間:付費5分鐘視窗,或付更多錢換1小時視窗。使用仍在快取中的資料便宜得多,管理得當能省下大筆費用。

但有個陷阱:每添加新資料到查詢中,可能就會把其他東西擠出快取視窗。這很複雜,但結論很簡單:AI模型的記憶體管理將是AI未來的重要組成部分。做得好的公司將脫穎而出。

TensorMesh這樣的新創公司正在快取優化這個新領域尋求突破。機會存在於堆疊的各個層面:從資料中心如何使用不同類型記憶體(DRAM vs HBM),到終端用戶如何架構模型群以利用共享快取。

亞洲視角:台積電與記憶體生態

從華人世界的角度看,這個趨勢特別值得關注。台積電在先進製程的領導地位,可能讓它在AI記憶體晶片製造中佔據優勢。而聯發科瑞昱等IC設計公司,也可能在記憶體控制器和優化晶片領域找到新機會。

中國大陸的長江存儲合肥長鑫等記憶體廠商,面對這波AI需求激增,既是機遇也是挑戰。地緣政治限制下,如何在技術自主與市場競爭間找到平衡,將考驗這些企業的策略智慧。

成本下降的連鎖效應

隨著企業在記憶體編排技術上日益精進,它們將使用更少令牌,推論成本將下降。同時,模型處理每個令牌的效率也在提升,進一步壓低成本。

當伺服器成本下降,許多目前看似不可行的應用將開始邊際獲利。這可能催生全新的AI應用生態。

本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。

观点

相关文章