熱門資訊> 正文
2025-02-20 11:11
轉自:樂觀的漂流瓶Ym
過去幾周,Deep Seek在全球科技圈掀起了一場「腥風血雨」,其影響力之大,從美股市場的劇烈波動中可見一斑。
受Deep Seek衝擊波影響,1月27日,美股AI、芯片股遭遇重挫,英偉達收盤大跌超過17%,單日市值蒸發5890億美元,創下美國股市史上最高紀錄。
這就好比Deep Seek在AI江湖中一劍封喉,直接把英偉達這樣的巨頭的股價給「削」了一大截。然而,Deep Seek的成功並非偶然,背后有一羣非常硬核的供應商。比如浪潮信息和中科曙光。
先説説浪潮信息。
公開信息顯示,浪潮信息的第一大股東是浪潮集團有限公司,持股比例高達31.93%。浪潮集團的第一大股東是山東省國有資產投資控股有限公司,而這家公司的第一大股東又是山東省國資委。再加上新增的濟南華勝企業管理股份有限公司、濟南山科科潮投資合夥企業(有限合夥)兩個股東,浪潮集團國資持股比例約七成,妥妥的國有企業。
作為國內領先的算力基礎設施供應商,浪潮信息為Deep Seek在北京亦莊智算中心提供了AI服務器集羣,還配備了英偉達H800芯片及自研的AIStation管理平臺。這就像給Deep Seek的研發工作鋪了一條「黃金大道」,更是國有資本在AI領域佈局的有力體現。
浪潮信息2月11日正式推出元腦R1推理服務器,它通過系統創新和軟硬協同優化,單機就能部署運行Deep Seek R1 671B模型。此舉直接把Deep Seek R1全參數模型的部署難度和成本給「砍」了下去,還把推理服務性能給「拉」了上來。
據悉,Deep Seek開源多版本模型里,Deep Seek R1 671B模型是個「狠角色」,號稱全參數基礎大模型。相比那些蒸餾模型,它泛化能力更強、準確度更高、上下文理解能力也更好,簡直就是AI界的「學霸」。
但它對系統顯存容量、顯存帶寬、互連帶寬和延迟要求極高。FP8精度下至少要800GB顯存,FP16/BF16精度下更是要1.4TB以上的顯存。而且,Deep Seek R1是個典型的長思維鏈模型,短輸入、長輸出,推理解碼階段特別依賴高顯存帶寬和極低的通信延迟。
元腦R1推理服務器的推出,直接祭出了「王炸」——領先的顯存容量、顯存帶寬和通信速度,完美契合Deep Seek R1的需求。這就好比給企業準備了一條「高速公路」,讓Deep Seek全參數模型的本地化部署一路暢通無阻。
中科曙光也是個「狠角色」。它給Deep Seek在杭州的訓練中心打造了一套液冷系統,單機櫃功率密度直接飆到35kW,PUE值還不到1.15。這簡直就是在AI訓練的「熱戰場」里,硬生生開闢出了一條「冷通道」,讓設備在高負荷運轉時也能穩如泰山。
這一液冷系統的建設,不僅為Deep Seek的訓練工作提供了強大的散熱保障,更是國有科技力量在數據中心基礎設施領域的創新成果。
公開資料顯示,中科曙光的股東陣營里藏着不少國有股東。其中,北京中科算源資產管理有限公司手握中科曙光16.36%的股份,其背后站着的是中國科學院計算技術研究所。中國科學院計算技術研究所是國內頂尖的科研機構,科研實力雄厚,技術底藴深厚,被稱為「科研界的扛把子」。中科曙光還有3.8%的股份被北京思科智控股有限責任公司持有,而這家公司背后又有深圳市國資委的身影。
簡言之,Deep Seek的成功,是中國產業鏈協同的結果。
企觀國資是企業觀察報社官方微信公眾號。《企業觀察報》是由國務院國資委指導、中國企業改革與發展研究會主管主辦的全媒體平臺,被國務院國資委認定為「國資國企自有輿論平臺」,致力於以專業化、市場化、國際化視角關注報道中國企業改革發展。
互聯網新聞信息服務許可證號:10120240005