熱門資訊> 正文
2026-03-26 08:50
TradingKey - 本周早些時候,谷歌(GOOG)(GOOGL)推出全新極端壓縮算法TurboQuant,該算法有望實現將內存使用量降低約6倍,並在相同GPU配置下提升最高8倍的運算速度,引發了半導體板塊的集體回調。
周三美股時段,美光(MU)、閃迪(SNDK)、西部數據(WDC)和希捷科技(STX)均下跌,並在周四盤前延續跌勢。
美股的下行壓力也傳導至亞洲股市。周四,三星電子收跌4.71%,SK海力士收跌6.23%,並拖累韓國綜合股價指數KOSPI下跌3.22%。這兩家公司本周以來已連續四連陰。
谷歌此項算法針對大型語言模型(LLM)推論過程中的存儲瓶頸進行最優化,從而在零精度損失的同時,降低內存使用並提升運算速度。然而,此項技術是否將真正顛覆半導體需求?近期影響有多大?
谷歌推出TurboQuant算法的消息迅速獲得市場關注,Cloudflare(NET)執行長Matthew Prince稱之為谷歌的DeepSeek時刻,AI技術效率實現了重大的歷史性突破。
華爾街指出,若成功落地,由於存儲需求將大幅下降,可能削弱原本因AI熱潮而大幅提升的DRAM與NAND Flash需求。今年1月,三星電子曾將NAND閃存合約價格上調100%以上,而在此之前DRAM內存價格已經上調近70%,足見半導體市場的火熱。
儘管全球半導體板塊集體降温,但高盛(GS)科技專家Peter Callahan則認為,市場未出現極大恐慌,但這表明投資者已經在對近期存儲股的驚人走勢進行合理性檢驗。
其實在谷歌的TurboQuant「黑天鵝」爆出之前,市場已經有所行動——存儲巨頭美光在交出強勁財報后,5天內股價漲幅落后費城半導體指數近20%,創2011年以來最大幅度的短期相對落后。
儘管TurboQuant算法理論上可以降低內存需求,但該技術目前仍處於研究階段,且未經過商業化驗證。
從技術層面來看,該技術實際上只適用於推論過程的動態顯存佔用(主要為 KV Cache),但不涉及模型權重本身。換而言之,此項技術最大的突破在於運行效率的提升,但大模型本身需要的存儲空間是無法降低的。
另外,考慮到AI模型參數量也在進行指數級增長,算法目前僅能壓縮節省最多6倍的存儲空間,或等同於杯水車薪。
此項技術的推出,最大的影響莫過於為目前過熱的半導體市場降温,戳破存儲股的估值泡沫,證明內存的需求或非完全沒有上限。隨着類似技術的推出和算法的進步,存儲需求的增長可能會面臨瓶頸。
值得一提的是,相比普通DRAM芯片,此項技術對HBM(高帶寬內存)影響會更小。TurboQuant主要用於優化AI模型推理,這一階段大多時候只需使用普通的DRAM芯片。但在AI訓練階段,HBM仍是剛需。對於美光、三星電子及SK海力士這三家HBM巨頭而言,TurboQuant算法近期幾乎不會帶來任何實質影響。