繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

谷歌新算法聲稱能「6倍壓縮KV緩存」 美股存儲板塊承壓走弱

2026-03-26 00:28

財聯社3月25日訊(編輯 史正丞)周三美股開盤后,在大盤情緒尚可的背景下,存儲板塊卻反向走弱。截至發稿,美光科技跌3.57%、閃迪跌4.12%,西部數據和希捷科技也一同下跌

image

(美光科技日線圖,來源:TradingView)

對於今日的市場異動,有多處信源均將矛頭指向了谷歌。AI巨頭早些時候推出了一種可能降低人工智能系統內存需求的壓縮算法TurboQuant

image

(來源:谷歌研究)

根據谷歌介紹,TurboQuant壓縮技術旨在降低大語言模型和向量搜索引擎的內存佔用。該算法主要針對AI系統中用於存儲高頻訪問信息的鍵值緩存(key-value cache)瓶頸問題。隨着上下文窗口變大,這些緩存正成為主要的內存瓶頸。

TurboQuant可在無需重新訓練或微調模型的情況下,將鍵值緩存壓縮至3bit精度,同時基本保持模型準確率不受影響。對包括Gemma、Mistral等開源模型的測試顯示,該技術可實現約6倍的鍵值緩存內存壓縮效果

image

此外,在英偉達H100加速器上的測試結果顯示,與未量化的鍵向量相比,該算法最高可實現約8倍性能提升。研究人員也表示,這項技術的應用不侷限於AI模型,還包括支撐大規模搜索引擎的向量檢索能力。

谷歌計劃於4月的國際學習表徵會議(ICLR 2026)上展示TurboQuant技術。

不難看出,雖然該技術的應用前景目前仍需要打一個問號,但市場已經開始交易內存需求前景轉變的預期。

對於最新變化,富國銀行TMT分析師Andrew Rocha解讀稱:「隨着上下文窗口不斷擴大,KV緩存中的數據存儲規模呈爆炸式增長,從而推高對內存容量的需求。而TurboQuant正是在直接壓縮這一成本曲線。如果該技術能夠得到廣泛採用,這對內存成本曲線而言將是利好。

Rocha同時表示,這項技術可能影響未來對內存容量規格的需求判斷。

他寫道:「如果實現這些AI應用所需的內存規格被顯著降低,那麼市場很快就會重新評估究竟還需要多少內存容量。」

不過Rocha也指出,目前仍不清楚該技術是否僅適用於谷歌自身體系,或能否推廣至其他AI實驗室。此外,實驗室環境下的測試結果是否能夠順利轉化為真實生產環境中的應用表現,也仍存在不確定性。

值得一提的是,作為攪動存儲板塊的事主,谷歌也沒撈着什麼好處。公司股價在周三一度跌破290美元,據2月初創下的349美元歷史高點已經回撤近17%,距離20%的關鍵心理位置也只有咫尺之遙。

image

(谷歌-A日線圖,來源:TradingView)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。