熱門資訊> 正文
2026-03-27 10:16
截至發稿,兆易創新(03986.HK)跌3.50%、瀾起科技(06809.HK)跌1.66%。
同期,南方兩倍做多三星電子(07747.HK)及南方兩倍看多海力士(07709.HK)均跌超7%。
消息方面,根據CFMS|MemoryS 2026閃存行業峰會的消息,存儲產品的價格已經歷了連續三個季度大漲,預計2026年三季度開始漲幅會放緩,逐漸收斂,一些具體產品線上價格會有一些分化。
對於客户,鎖定存儲產能比鎖定價格更重要。相比起火熱的AI市場,以手機為代表的消費類市場就進入陣痛期,成本迅速上升,預計銷售量將下降約10%,部分手機降幅最高將達30%。
同時,隔夜美股存儲芯片板塊遭遇重挫。美光科技連續第六個交易日收跌,單日跌幅6.97%,較3月18日創下的歷史高點累計回撤逾23%;閃迪、希捷、西部數據分別下挫11.02%、8.33%與7.70%。
市場情緒進一步承壓,部分源於谷歌於3月26日發佈的TurboQuant AI內存壓縮算法引發的行業關注。
據悉,該算法專為大語言模型推理過程中的KV緩存場景設計,通過創新壓縮技術將16bit或32bit緩存數據壓縮至3bit,內存佔用降至原有水平的1/6,且無需模型重訓練或微調即可實現長上下文推理的零精度損耗。實測表明,其4bit版本在英偉達平臺上的推理速度較32bit基線提升約8倍,在壓縮效率、精度保持與推理性能間取得突破性平衡。
該技術具備即插即用特性,已適配Gemma、Mistral等主流開源模型,可廣泛應用於AI服務器、邊緣計算及移動端設備,顯著降低大模型部署的算力與內存成本。
谷歌於2026年3月26日正式發佈革命性TurboQuant AI內存壓縮算法。該技術專為大模型KV緩存場景優化,通過創新性算法將16bit或32bit模型緩存數據壓縮至3bit,實現內存佔用縮減至原有水平的1/6,同時無需對模型進行重新訓練或微調,即可保障長上下文推理的零精度損耗。
實測數據顯示,其4bit版本在英偉達芯片平臺上的推理速度較傳統32bit基線提升8倍,成功在壓縮比、精度損失與性能表現之間取得突破性平衡。
機構稱AI應用部署成本的下降有望激發更廣泛的需求增長
針對市場擔憂,多家行業研究機構指出,TurboQuant AI的核心優化聚焦於推理環節的緩存效率,並未觸及HBM高帶寬內存、模型權重存儲等存儲芯片的核心應用場景。從中長期視角看,AI應用部署成本的下降有望激發更廣泛的需求增長,反而為存儲芯片市場拓展增量空間。
當前股價波動主要受短期情緒擾動影響,行業基本面未發生實質性改變。頭部存儲廠商憑藉持續的技術迭代能力、產能佈局優勢及產業鏈韌性,仍具備穩健發展的堅實基礎。