熱門資訊> 正文
2025-10-24 20:20
(文/觀察者網 陳濟深;編輯/張廣凱)
「沒有高性能計算(HPC),就沒有大模型。」
清華大學高性能計算研究所的學者、國內大模型領域早期研究與生態建設的重要推動者之一的韓旭在今年7月的這句論斷,概括了算力基石對於人工智能的重要性。
所謂HPC是指利用超級計算機或大規模計算集羣,在極短時間內完成單機無法勝任的複雜計算任務。它的核心目標是「用並行計算換取時間」——把大問題拆成無數小塊,讓成千上萬顆 CPU/GPU 同時運算,幾天甚至幾小時就得出結果。
早在大模型出現之前,HPC就已經在用算力解決很多複雜問題,但由於其架構並非為生成式大模型設計,CPU在其中仍然扮演着核心地位,這在GPU主導的大模型時代自然會帶來疑問:中國曾經重金投入的HPC建設過時了嗎?它與AI,究竟應當如何融合?是簡單的算力疊加,還是深度的架構變革?
帶着這些問題,我們與太初(無錫)電子科技有限公司(以下簡稱「太初元碁」)首席產品官洪源進行了一場對話。
作為HPC+AI融合路線的堅定提出者和一線實踐者,洪源的分享為我們揭開了智能計算產業在喧囂之下,一條清晰、務實且充滿信心的破局之路。
這不僅是一家企業的戰略思考,更是對整個中國計算產業在關鍵歷史節點上的一次精準把脈。
AI時代,不止GPU
在AI浪潮席捲之下,一個觀念似乎已深入人心:CPU的時代已經過去,現在是GPU的天下。
而長久以來,業界對HPC與AI的融合之路也充斥着質疑。一些權威聲音,例如來自國防科技大學的專家就曾指出,HPC以CPU為核心,追求極致的雙精度與低延迟,而AI則依賴GPU生態,側重低精度與高吞吐,兩者技術路線存在「天然矛盾」。
英偉達現在的如日中天,與英特爾的舉步維艱,就是CPU/GPU之爭最形象的表現。
但當GPU主導一切的觀點幾乎成為行業定論時,洪源卻給出了一個源自產業一線的核心判斷:「HPC+AI融合並非憑空設想,而是客户真實需求驅動的結果。」
這一核心判斷的根源,是基於用户對於算力的真實訴求。「用户對於算力的需求其實一直都沒有變。」
洪源認為,「概括起來有三點:第一,如何獲得相對低成本的算力;第二,這些算力能不能解決我的最終問題;第三,用算后能不能帶來新的價值。」
要理解為何客户的需求必然導向融合,我們需要深入剖析當前主流算力架構的優勢與天花板。
首先是當前最為人熟知的GPU(圖形處理器)。它以圖形渲染起家,憑藉數千個並行計算核心,在處理浮點數據方面能力強大,天然適合AI訓練中海量的、結構單一的矩陣運算。
爲了更好地支持通用計算,業界逐漸發展出GPGPU(通用圖形處理器),即減弱傳統GPU的圖形顯示能力,將資源全部投入到計算中。
然而,這條看似康莊大道的路徑,其隱憂同樣明顯。由於GPGPU並非從通用計算原生出發,而是在傳統GPU架構上「去圖形化、強計算化」,導致其在功耗、內部指令調度等方面存在先天的妥協與冗余。
對於國內玩家而言,選擇類CUDA體系雖然能借助其成熟生態快速迭代,但也意味着產品路徑趨同,在覈心調度與驅動技術上難以擺脫依賴,其發展上限被牢牢鎖定。
其次是ASIC(專用集成電路)。這類芯片為特定算法(如音視頻解碼)量身定製,在特定場景下能做到性能最優、功耗最低,非常適合AI推理等固化場景。
但其「成也蕭何,敗也蕭何」——架構被固化在晶圓中,靈活性極差。一旦算法變更(如Transformer結構變形、激活函數變動),芯片幾乎無法適配。對於AI這種技術快速演進的領域,押注ASIC無異於一場豪賭,商業化風險極高。
這兩種主流架構的盛行,催生了一種普遍的行業思維:即認為大多數複雜的計算問題,都可以通過簡單地「AI化」(用AI算法重構問題)或「GPU化」(用GPU硬件加速解決)來應對。
「這並非技術上的落后與先進之爭,而是不同技術方案對特定問題域的‘適配性’問題。」洪源的這句話點明瞭核心。許多關鍵行業的核心計算任務,並不能被簡單地「AI化」或「GPU化」,其計算流程往往是 「強邏輯、高精度、複雜流程」 與 「大數據量、模式識別」 的混合體。
具體到特定任務,從計算精度看:傳統科學計算(HPC)常要求FP64雙精度浮點運算以保證結果的準確性,而主流AI訓練則普遍使用FP16/BF16單精度乃至INT8整型來提升計算吞吐量。
而從任務流程看:GPU擅長「一張大網算到底」,但對於需要頻繁邏輯判斷、任務調度和高頻交互的複雜流程,其內部指令調度能力相對較弱。這時,CPU強大的通用計算能力和靈活的控制邏輯反而更具優勢。
基於異構眾核的通用高性能計算芯片
華為可信計算首席科學家金意兒教授在2024年OpenHarmony技術峰會上也表達了類似觀點:「未來芯片系統最主要的模式,將是集成通用多核處理器及專用加速處理器,同時獲得通用處理器的靈活性和專用加速器的性能效率。」這也意味着,不走傳統GPU路線,並非無奈之舉,而是在深刻理解客户需求后,主動選擇的一條技術上更優、更具適應性的道路。
正是基於這樣的技術判斷,那些看似「矛盾」的HPC與AI需求,在實際應用中找到了融合的落點。
太初元碁選擇並堅持走異構眾核的技術路線,打造通用高性能計算芯片,將HPC與AI深度融合。異構眾核建立了一套更立體化的計算邏輯,適合各種通用計算場景,滿足人工智能計算效率的同時,也能支持高精度科學計算。
異構眾核是將不同架構的計算核心依據相關技術標準和規範有機內在融合在一顆芯片上,任務由最合適的工作單元來承擔,不同異構內核之間實現協同計算。其在構建專用領域最大優勢在於可根據領域的應用需求在芯片的系統架構設計中,靈活的分配通用計算與加速部分的配比,並且根據領域應用的特點設計為某個特定的領域問題設計專用的計算架構,同時在編程性上通過統一的編程模型實現異構系統的無縫整合。
對於開發者而言,異構眾核架構的優勢在於計算任務的拆解和並行處理上的便利性。基於嚴謹標準體系的設計,不同處理器單元之間能有機融合和對接,降低產品開發門檻。同時,為算法開發人員提供了更多的計算任務分解可能性,全棧開源的基礎軟件生態為技術創新提供了更高效的平臺。
異構眾核的諸多特點使得太初元碁自研的AI芯片在性能與功耗、產品開發、差異化創新與更改靈活性以及生態構建等方面展現出明顯優勢。
洪源對觀察者網解釋道,在許多前沿領域,單一的技術路線已無法滿足日益複雜的計算需求,如何能夠高效、並行去進行海量數據處理,成為許多行業、客户關注的問題。「在高性能計算的場景里面,其實客户也有很多做人工智能計算的這種結合的需求。」
氣候氣象領域可以認為是高性能計算紮根最深的領域之一,基於對全球大氣和氣候的海量數據,該領域常藉助高性能計算來開展科學研究。AI大模型引入后,短臨預報(一般為未來3小時的天氣預報)的預測耗時可以從過往的6小時縮短到1小時,這是HPC+AI提升效率和準確度最直觀的一個應用領域。
在生物醫藥領域,新葯研發的「雙螺旋」正在形成:AI大模型利用其強大的模式識別能力,從數以億計的分子組合中篩選出最具潛力的候選藥物,將過去需要數年的篩選工作縮短至幾周甚至幾天;而被選中的「天選之子」,則需要通過HPC進行精確的分子動力學模擬,預測其與靶點蛋白的結合效果和潛在副作用。AI的廣度與HPC的深度在此完美結合。
在能源勘探領域,AI正在成為地質學家的「透視眼」。通過學習海量的地震波數據,AI能夠以前所未有的精度勾勒出地下深處的地質構造。而一旦確定了潛在的油氣藏,HPC便會接管,通過複雜的流體力學模擬,優化鑽井方案和開採策略,最大化資源利用率。
「這些其實都是有高性能計算和人工智能計算結合的這樣一個融合的需求,」洪源總結道,「AI雖作為智能化發展的推動力,但沒有辦法替代所有的計算需求,因此芯片僅兼容低精度能力遠遠不夠。」 這種來自產業一線的真實呼喚,正是太初元碁堅定走上HPC+AI融合之路的根本原因。
中國可以有自己的算力生態
在當下的AI領域,英偉達CUDA生態的強大影響力毋庸置疑,它幾乎成爲了算力的代名詞,讓整個行業形成了一種默認的「路徑依賴」。
然而,一個常被忽視的事實是,英偉達GPU本身的發展就與HPC密不可分,甚至可以説,其通用計算能力正是在HPC領域的應用需求下發展壯大的。
事實上,觀察當前市場主流的數據中心GPU,其架構本身就是在單一芯片上集成了服務於AI的低精度張量核心(Tensor Cores)和HPC所需的高精度計算單元。這恰恰從側面印證了HPC與AI的融合並非異端,而是行業發展的必然趨勢。
當然,強大的硬件只是第一步。真正構建起行業「路徑依賴」的,是其上層的CUDA軟件生態。
對此,洪源認為,任何強大的生態都非一日之功。「CUDA生態是挺偉大的,但強大的生態也是一步步建立起來的。」他回顧道:「早些年它也是這麼干出來的,只是后面慢慢形成一個標準,所有人都圍繞它去做的時候,它就可以賣標品了。」
這正是國產算力建設者們的信心所在。既然融合是共識,那麼實現融合的路徑便不必只有一條。
洪源認為,中國算力的未來,不應是簡單的模仿或依附,而是要走出自己的道路。「中國要想把自己的產品做好,其實它應該是有它自己的,既兼容幷蓄、又有自己特點的這樣一個生態。」
「兼容幷蓄」,意味着尊重用户習慣,在技術上兼容現有主流框架,降低開發者的遷移成本。「有自己特點」,則意味着敢於在主流視野之外,根據產業的真實需求,探索更高效、更自主的技術路徑。
太初元碁的「異構眾核」架構,以及與龍芯中科合作2小時適配DeepSeek的成功實踐,正是這一理念的生動註腳。它證明了在CUDA生態之外,通過軟硬件的深度協同,同樣可以為頂尖大模型提供強大的算力支持。這不僅是一次技術上的突破,更是構建全新自主產業生態的一次關鍵探索,它向業界展示了另一條道路的可能性。
從「強制替代」到「質優價廉」
「客户接受新的解決方案,是需要一個過程的。」洪源坦言。他認為,國產算力市場的心態演變,清晰地劃分爲三個階段。
第一階段,是「國產替代」政策驅動下的強制使用。在這一時期,用户的選擇更多是出於戰略安全考量,對性能和易用性的疑慮普遍存在。緊接着,是國產廠商奮起直追、性能逐步跟上的第二階段。隨着技術的不斷迭代,國產算力開始在越來越多的場景中證明自己「能用」且「夠用」。
而今天,市場正全面進入第三階段——性能平替下的高性價比階段。「越來越多行業,越來越多的用户,包括客户的決策人,他認識到我們自己的解決方案是能夠滿足需求的。」洪源判斷道。這種心態的轉變,可以用一個詞來生動比喻,那就是「真香」。
但「真香」的體驗遠不止於採購成本,更體現在解決數據中心建設的「不可能三角」上。洪源指出,尤其在北京這樣的大城市,客户對算力密度、能耗(PUE值)的要求越來越高,建設成本卻要嚴控。對此,太初元碁推出的高密液冷解決方案,正是破局的關鍵。
這並非簡單的技術堆砌,而是一筆需要算「總賬」的經濟學。「初期購買和液冷建設成本可能會有一點上升,」洪源坦誠,「但是從未來5到10年的長期運營成本和單位算力成本來看,優勢是巨大的。」 高密度部署節約了寶貴的機房空間,而液冷技術則有效解決了散熱難題,大幅降低了PUE值和電費開銷。
回看近兩年太初元碁的發展之路,業務與訂單便是市場對其最大的肯定。公開資料顯示,太初元碁已參與多個國家公共算力基礎設施建設,包括鹽城超級計算中心、蠡湖未來城算力中心、延安智算中心等。日前,央視《新聞聯播》對於中國聯通三江源智算中心項目的報道中,眾多擬簽約名單里也出現了「太初」字樣。同時,觀察者網瞭解到,截止到今年第三季度,太初元碁拿下多個商業訂單,總金額已超過3億元。從營收增長來看,太初元碁近年年均營收增長均超過100%。
算力產業的「慢」與「深」
與上層大模型「以周為單位」的瘋狂迭代相比,底層的算力產業遵循着截然不同的發展邏輯。當模型廠商爲了參數量和排行榜而陷入「迭代焦慮」時,洪源和他的團隊卻顯得異常清醒和堅定。
「很多大模型卷參數,但你卷完之后到底用在哪?有人説不重要,先把參數提上去,跑分不能輸。」洪源一語道破了模型層的浮躁。他認為,這種模式不適用於算力行業。「芯片一個設計就是一兩年,再出來產品周期一兩年,整個三四年、四五年就過去了。這個行業其實就不適合賺快錢的人來干。」
這種「慢」,並非迟鈍,而是一種必然的厚重。算力是基石,追求的是極致的穩定、能效和長周期的經濟性。它需要的是戰略定力,而不是戰術跟風。洪源將這種定力總結為「聚焦應用」。無論是與東潤數字能源合作,將HPC與AI的能力注入新能源電廠的選址、調度和交易,還是賦能科研機構進行更復雜的科學計算,太初元碁的每一步都緊緊圍繞着「解決真實世界的問題」。
「潮水退去之后,才知道誰在裸泳。」洪源的這句話,是對整個算力產業的最好註腳。在資本和概念的熱潮中,唯有那些踏踏實實打磨產品、深入行業創造價值的企業,才能擁有穿越周期的能力。拒絕迭代焦慮,迴歸應用本質,這不僅是太初元碁的選擇,也應是整個國產算力產業走向成熟的必經之路。
百家爭鳴,殊途同歸
放眼當下的智能計算市場,呈現出一派「百家爭鳴」的繁榮景象。從太初元碁的HPC+AI,到其他廠商的多元化探索,不同的技術路線並行發展。對此,洪源表現出開放和樂觀。
「生態和市場足夠大,其實是能容得下行業里面優秀的企業一起去做一些事情的。」他認為,當前階段,每家企業首先需要找到自己最擅長的發力方向,明確自身優勢與定位。「這是大家協同服務客户的基礎。」
然而,百家爭鳴只是過程,而非終局。洪源同樣認為,構建統一的產業聯盟和行業標準,是未來的必經之路。「我們也不希望客户要去適配過程,每家就重新適配一遍,其實切換成本也高。」他透露,太初元碁從一開始就堅持開源開放的路線,並積極參與工信部等機構推動的大生態建設。最終的目標,是殊途同歸——共同打造一個強大、協作、繁榮的中國算力新生態。
在對話的最后,洪源對大模型行業的未來給出了自己的看法。洪源認為,當前的文本大模型技術正趨於穩定,而真正的下一個算力需求爆發點,將在於以視頻生成為代表的「多模態」應用。
「我個人的判斷應該就是在多模態系統,」他分享道,「未來如果視頻能夠很好的做分析做處理,甚至做合成,這塊的算力可能又是一個指數型的(增長)。」
這場圍繞算力的長征,依然在路上。而在這場沒有硝煙的戰爭中,以洪源為代表的中國算力建設者們,正以他們的遠見、務實與堅持,為未來鑄造着最堅實的「中國芯」。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。