熱門資訊> 正文
2025-02-13 19:54
炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!
在當今科技前沿的服務器與GPU領域,諸多關鍵要素猶如精密的齒輪,相互咬合,驅動着整個系統高效運轉,它們對於系統性能、后續演進均起着無可替代的關鍵作用,值得我們深入剖析。
且看Socket在芯片中所扮演的關鍵角色。Socket仿若芯片的專屬「科技基座」,恰似為承載芯片量身打造的穩固「港灣」,類比於承載食物的餐盤,其重要性不言而喻。它藉助內部的pin針與芯片引腳精準對接,從而搭建起數據與信號傳輸的「高速通道」。形象地説,數據運算宛如飛馳的「信息流」,通過pin針順暢地湧入GPU芯片內部完成處理,而后運算結果又沿着引腳有序輸出。引腳功能多元且強大,既能為芯片提供源源不斷的電能供應,又能充當連接CPU、網卡等外圍設備的「橋樑」,確保各組件之間實現無縫的數據交互。Socket更是肩負起將二維平面的芯片與主板緊密相連的重任,使得GPU或CPU得以與主板之間構築起穩定且高效的數據鏈路。相較於傳統的SMT(貼片焊接)方式,Socket這種插槽式設計無疑展現出了卓越的便利性,芯片能夠輕松嵌入Socket插座,而在面臨維修、升級等需求時,亦可便捷地拔出,極大地優化了硬件的組裝、維護以及升級流程,宛如為硬件系統賦予了靈活應變的「超能力」。
GPU芯片通常具備多少引腳?
一般而言,GPU芯片的引腳數量往往在1000個以上,這些密密麻麻的引腳如同芯片的「神經網絡」,分佈於單顆GPUdie之上,肩負着供電、數據傳輸以及連接外圍設備等多重使命。以GB200為例,在其一個節點架構中,涵蓋兩組superchip,而每個superchip又巧妙集成了兩個GPUdie與一個CPUdie,如此一來,一個GB200節點總計包含四個GPUdie和兩個CPUdie。在此種配置之下,每個節點便需要藉助四個GPUsocket和兩個CPUsocket來完成硬件層面的完美連接,構建起一個協同運作的「科技矩陣」。
當前Socket封裝形式與傳統封裝形式的差異
此Socket封裝絕非傳統的SMT貼片工藝,它更像是臺積電精心打造的一種「芯片封裝藝術」,先是對整個GPU芯片進行全方位封裝,待芯片封裝完畢后,在OEM廠商端着手主板製造,進而完成GPU芯片與主板的組裝整合。得益於Socket的存在,無需再通過SMT工藝將芯片焊接至主板,而是憑藉Socket形式直接實現高效組裝,且在拆卸時亦展現出便捷性,為整個硬件製造與維護環節注入了科技化的「靈動因子」。
SMT工藝由哪些廠商負責?其應用情況如何?
談及SMT工藝,早期主要由富士康擔綱負責,諸如早期的H卡和A卡產品均採用這一工藝模式。不過,彼時這些產品並未採用Socket,而是將GPU直接焊接於底板之上,並輔以堅固的外框進行加固,旨在避免運輸過程中可能出現的損壞風險。以GB200系列為例,其設計架構中摒棄了pin針,直接將芯片焊接到主板,同時依靠外框提供額外保護,內部並不存在引腳結構。然而,在后續諸如Rubin等產品的迭代中,逐步引入了插槽式Socket設計,這一設計變革宛如一場「科技革新風暴」,帶來諸多優勢,不僅簡化了組裝流程,還極大提升了市場適配性,更打破了以往像緯創或富士康等少數廠商對底板製造的壟斷局面,降低了對單一廠商生產能力的依賴程度。大型OEM廠商憑藉成熟的SMT工藝水平,能夠確保生產質量的高度一致性,為整個系統的穩定運行築牢根基;而小型廠商受限於經驗不足,技術水平尚有待提升,需進一步強化製造能力,方可在激烈的市場競爭中嶄露頭角。
回溯早期GPU卡及其底板的生產環節,為何會選定緯創或富士康作為供應商?
實則在早期階段,整體市場需求量相對有限,若將有限的產能分散至眾多廠商,必然導致端到端成本水漲船高。因此,權衡之下通常選擇一到兩家供應商,以此有效緩解供應鏈壓力。就如2023年,緯創因自身產能不足,便將部分底板生產任務轉移至富士康新增的產能板塊。對於SMT工藝而言,即便數百萬片的訂單量,放在整個產業規模中亦算不上龐大。
倘若主板市場放開,這對於ODM廠商的利潤率又會產生何種影響?
一旦未來主板市場迎來開放格局,各大ODM廠商便能憑藉自身實力自主完成更多部件的設計與製造工作,進而實現利潤率的顯著提升。以售價處於290萬至300萬美元區間的機櫃產品為例,ODM廠商當前整體純利潤大致在7萬至10萬美元左右。若主板授權得以放開,預計淨利潤有望提升30%左右,當然,這一提升幅度因廠商而異,像富士康由於涉及更多部件,其利潤率相較於其他競爭者或許更具優勢,猶如在這場「科技利潤博弈」中佔據了有利地形。
主板授權放開的具體機制究竟如何?
這一過程需同時獲得英偉達(NV)的官方許可(金麒麟分析師),並順利通過美國政府的嚴格審查,涵蓋客户備案、政策合規性檢查,諸如BIS調查等一系列嚴謹程序。唯有成功通過上述審查環節,產品諸如GB200或GB300方可正式交付市場。值得注意的是,美國政府對部分企業,例如Supermicro的嚴格審查,已致使其交付周期大幅延長,甚至出現訂單取消的情況。由此可見,未來若要正式銷售相關產品,拿到NV授權並通過美國政府審查,已然成為不可或缺的關鍵步驟,畢竟客户需完成備案且獲得政府認可,方能開啟GB200或GB300等產品的銷售之旅。
主板授權放開后ODM利潤提升的內在邏輯是什麼?
當下,ODM廠商主要負責研發、集成、生產測試、包裝以及運輸等多個環節,然而核心部件大多依賴外部採購。在GB200產品層面,ODM廠商利潤獲取的關鍵環節在於集成測試部分,這一環節傾注了大量資源,前期需緊密配合NV客户端開展需求對接、前期研發測試等工作,相應投入成本亦會分攤至產品報價之中。諸如GBSuperchip、液冷組件、冷板、manifold、電纜、DPU網卡以及風扇等關鍵組件皆需從外部採購。因而,GB200階段的ODM廠商更像是專業的集成服務提供者,其前期研發投入側重於需求對接和測試環節,並非聚焦於核心技術開發,這也導致整體利潤空間相對受限,不過富士康憑藉自身優勢,在此方面可能略勝一籌,在這場「科技利潤版圖」中分得相對更多的份額。
Rubin相較於GB300,藴含了哪些引人矚目的技術更新?
Rubin預計將於2026年重磅登場,其具備諸多亮眼的科技特性。在插槽設計方面,依舊沿用先進的socket工藝,而在網絡端,更是創新性地引入光纜互聯CPO技術,旨在逐步替代傳統的銅纜連接方式,儘管目前該項技術仍處於研發攻堅階段,但已然展現出巨大的應用潛力。這一技術變革有望顯著削減信號衰減,極大拓展傳輸距離,為數據的高速、穩定傳輸開闢全新「科技通道」。在電源部分,功率將從現有的5.5千瓦躍升至約10千瓦,以充分滿足日益增長的高功耗需求,助力系統在高強度運算場景下穩定運行。當前,GB200和GB300採用24個或36個5.5千瓦的電源模塊,而Rubin憑藉更高功率電源的應用,不僅能夠提升系統可靠性與性能表現,還能因單個電源功率提升而減少電源數量,從而釋放出更多寶貴空間,用以安置計算節點(compute)和NVSwitch節點,打造出更為緊湊且高效的內部結構。以Rubin機櫃為例,通過多個機櫃巧妙組網,能夠構建起一個強大的整體GPU系統,實現288塊GPU卡的互聯互通,這一設計無疑是對空間利用率和計算能力的一次重大「科技優化升級」。
此前提及的24和36個電源配置,是否是GB200和GB300的本質區別?
實則不然,GB200最低配置大約為24個電源,每個電源功率為5.5千瓦。而GB300系列則可依據業務負載需求靈活選擇電源配置,可選用24個5.5千瓦的電源,亦能按需增加冗余配置,特別是在負載處於90%-100%且對可靠性要求頗高的場景下,增加冗余配置能夠有效避免因單點故障引發的運算中斷或系統關機風險,確保整個運算過程的連續性和穩定性,猶如為系統構築起一道堅固的「科技防線」。
GB300是否依舊沿用200kW的方案?
答案是其電源方案並無太大變動,它能夠選擇5.5千瓦乘以24、5.5千瓦乘以36甚至乘以48等多種配置模式,不過需結合具體業務需求進行抉擇,且電源數量不得低於24個。然而,考慮到成本因素,每台5.5千瓦電源的造價約為1萬元人民幣或2000美元,受此影響,客户通常會將24或36臺電源作為主流選擇方案,48臺電源的配置相對較為少見,成為這場「科技成本考量」中的小眾選項。
若Rubin提升至10kW功率,大概需要配備多少個電源?
就目前而言,單個機櫃所需電源數量通常不會少於16個,這是由於其採用並櫃設計,相當於構建一個大型的集成機櫃,需配置四個機櫃以及四個電源框,每個電源框大約涵蓋16個電源,綜合計算下來,總共約需64個電源左右,這些電源如同「科技能量源」,為整個系統提供強勁動力支持。
為何要採用乘以4的設計?
這是因為系統內部實則劃分了多個電源框,而后進行合併整合。鑑於當前並無超大尺寸機櫃能夠一次性容納如此眾多的GPU芯片,所以必須採用分櫃運行的模式,將運輸、工廠測試等環節分別開展,直至最終交付至客户機房時,再將各個機櫃進行並櫃操作,使其形成一個具備288塊GPU卡的完整機櫃。並且,客户在購買時無法進行拆分採購,最低採購單位即為288塊GPU卡,這是因為機櫃內部的各項參數、互聯設置等均是按照288塊GPU卡的規模進行統一規劃與配置的,由此也凸顯出Rubin與GB系列在設計理念上的顯著差異,GB200或GB300可支持單獨購買一個機櫃,而Rubin下一代產品則更傾向於以整體並櫃的形式呈現,猶如一個「科技鉅艦」,承載着更強大的運算能力。
Rubin系統是否會採用高壓直流(HVDC)供電方案?
從技術發展趨勢來看,Rubin系統大概率會採用高壓直流供電方案,這一方案相較於傳統交流供電,宛如一場「能源革命」,能夠顯著提升能源轉換效率,大幅降低能耗成本,為整個系統的綠色、高效運行提供有力支撐。服務器的穩定運行離不開電源的有力保障,若電源具備支持HVDC高壓直流的功能,那麼在多數情況下均可滿足系統供電需求。此前,在部分產品的部署場景中,高壓直流供電已得到一定應用,尤其適用於核心機房環境。不過,對於中小機房而言,由於其變壓器等基礎設施往往並不支持高壓直流,整個機房配套設施也缺乏相應支持,所以未來Rubin系統將主要應用於核心數據中心、核心機房等具備相應條件的場所,從而充分發揮其高壓直流供電的「科技優勢」。
高壓直流技術在Rubin中的應用比例將會如何?
據專業推測,Rubin系統有望實現100%的高壓直流覆蓋,這主要歸因於其整體功耗極爲龐大,高壓直流供電不僅能夠有效削減能源損耗,還能完美契合超大規模計算對於穩定性和效率的嚴苛要求,成為保障系統高效運轉的「科技密鑰」。
高壓直流屬於櫃外方案,更多地由CSP廠商進行決策,目前已知Meta似乎已確定採用該方案,而其余三家的態度尚不明朗。那麼,這三家未來是否也會採用這一方案?
從產品應用的通用性角度出發,無論客户機房是否具備高壓直流條件,產品自身都必須具備支持該功能的能力,否則極易引發部署方面的諸多問題,影響系統的正常上線與運行。因此,在產品配置設計與交付流程中,已然將支持高壓直流作為一項標準化要求加以落實,目前的配置建議均明確指向全面支持高壓直流,這一舉措正是從ODM廠商層面進行實施推進的,旨在確保整個產業鏈條在技術應用上的協同性與一致性。
高壓直流的支持是從哪一代產品開始實施的?
實際上,從GB系列產品便已開始逐步普及這一技術,其中H200部分型號已經具備高壓直流功能。而在更早的產品中,多數並未提供此項支持。基於當前的發展態勢以及客户需求綜合考量,預計Rubin系列有望實現100%採用高壓直流方案。當然,若部分客户出於成本因素的考量,廠商也可能針對特定客户提供不帶高壓直流功能的定製版本,不過需要注意的是,採用高壓直流方案在總成本上相較於普通方案大約會增加5%左右,這也是在「科技成本權衡」中需要斟酌的一個關鍵因素。
GB300與GB200相比,其主板設計出現了哪些變化?
GB300的主板面積相較於GB200增加了約30%,這一變化背后藴含着獨特的「科技考量」。GB200基於superchip架構,其部件呈現高度集成化特點,如此設計旨在便於運輸,確保產品在物流環節的穩定性與便捷性。而GB300則採用了擴展布局的設計思路,將原本集成於superchip上的部件分散佈局至更大面積的主板之上,並且額外新增了一個socket接口,這進一步拓展了主板面積。這一設計調整不僅有助於優化散熱性能,為芯片在高負載運行下提供更為穩定的「熱環境」,同時又需謹慎把控面積增長幅度,避免因面積過大導致貼片元件出現失效或虛連接等潛在問題,猶如在「科技平衡木」上精準把控每一個細節。
新增socket對成本會產生何種影響?
新增的socket無疑提升了整體的價值量。從單個部件角度審視,CPUsocket的價格通常處於幾十美元的區間,而GPUsocket由於其pin針數量更為可觀,對材質的要求也更為嚴苛,例如在耐温性、可靠性以及鍍金含量等方面有着更高標準,並且承載重量的需求也更大,諸多因素疊加使得GPUsocket的價值量遠超CPUsocket,成為主板上除CPU、GPU之外價值頗高的關鍵組件之一。當前,GPUsocket的樣品採購價格大多集中在數百美元的範圍之內,隨着后續量產規模的逐步擴大,預計其價格將會有所下降。待量產並引入第二供應商之后,GPUsocket的單價有望降至約100美元左右,即便如此,鑑於其自身的精密度與材質要求,其價格仍相對較高,與CPUsocket之間存在着明顯的「科技價值差」。
GPUsocket的定價是依據何種單位進行計算的?
若按照整機櫃來計算,總成本又該如何估算呢?GPUsocket的定價是以每組三顆die為單位進行覈算的。若從整機櫃角度出發進行成本估算,每臺機櫃需配置72組GPUdie和36組CPUdie。按照量產后預估的價格進行計算,GPU部分的成本即為100美元×72,CPU部分則為50美元×36,總計成本大約為10,800美元。此外,CPU部分在未來亦存在降價空間,不過預計其價格不會低於20-30美元,這一系列的成本數據也成為產業鏈上下游在「科技成本規劃」中的重要參考依據。
GPUsocket的具體組成結構是怎樣的?
pin針是否包含在socket採購範疇之內呢?GPUsocket主要由底座、外圍框架以及pin針這三大部分構成,在實際採購過程中,企業通常是從專業的socket廠商進行採購,而這些socket廠商自身亦擁有相應的pin針供應商,共同構建起這一「科技組件供應鏈」。
大家是否瞭解和林微納?
據悉,在前期的工廠和實驗室測試階段,曾有采購和林微納產品的情況發生,不過就量產環節而言,目前只能説其存在一定機會。在國內市場,和林微納應當也為部分CPUsocket提供了供貨服務。該公司起初主要專注於pin針的供應業務,實則其自身亦具備socket的生產製造能力,在整個科技產業鏈中亦有着不可忽視的潛在影響力。
pin針在socket中的成本佔比是多少?
其單獨售價又該如何進行估算呢?pin針成本在整個socket價格中所佔比例大約為70%,以量產后單價為100美元的GPUsocket為例,其中pin針部分的成本便約為70美元,這一高佔比充分彰顯了pin針在精密度與數量方面的高要求以及其在整個socket組件中的重要地位,可謂是「科技成本結構」中的關鍵要素。
當前市場上,有哪些主要的socket廠商參與競爭?
在這一領域,主要的參與者包含來自臺灣地區的企業,例如LOTES,以及鴻騰精密等。鴻騰精密作為富士康旗下的子公司,其生產的產品更多地應用於富士康內部的供應鏈體系之中,而外部客户往往更傾向於選擇LOTES等廠商所提供的產品,目前市場上使用較為廣泛的便是由臺灣LOTES生產的socket產品,形成了一種特定的「科技市場格局」。
富士康為何能夠降低其內部使用socket產品的成本,而外部客户卻面臨着相對較高的費用?
這背后的關鍵在於富士康通過自有工廠或業務單元(BU)實現了端到端的生產模式,涵蓋開模、採購pin針以及組裝等全流程環節,憑藉這種高度整合的生產方式,有效降低了整體制造成本,構建起自身的「科技成本優勢」。反觀外部客户,由於依賴外購模式,各個生產環節相對分散,導致總成本相對偏高,在這場「科技成本博弈」中處於相對劣勢地位。
在GPU和CPU領域中,各類socket及pin相關產品的毛利率與淨利率分別處於何種水平?
對於GPU/CPU領域內的socket產品而言,其毛利率通常維持在20%-30%的區間範圍之內,淨利率略低,但也不會低於15%。而對於pin針產品來説,因其技術含量較高且市場需求相對穩定,其淨利率能夠達到20%左右,高於socket成品。這種差異源於二者在製造複雜性以及附加值方面的不同定位,當然,前期一些測試樣品由於其特殊性,價格相對來講會偏高一些,這也是行業內常見的「科技產品價值特性」體現。
那當前pin針市場的競爭格局是怎樣的呢?
主要廠商的市場地位又是如何分佈的呢?在pin針領域,鴻騰精密、和林微納以及泰科等廠商均具備生產能力。鴻騰精密由於隸屬於富士康集團,其產品在富士康內部的使用佔比較高,所以在市場份額方面相對領先。其次是泰科,該公司不僅能夠直接供應socket,還能提供pin針,服務於下游眾多客户,在市場中也佔據着重要地位。而和林微納則尚處於測試驗證階段,其產品在后續量產環節是否會被大量採購還存在不確定性,目前在市場中影響力相對有限。整體來看,台系廠商對大陸廠商似乎存在一定程度的排斥現象,即便大陸廠商在產品性能和價格方面具備優勢,卻仍未成為市場的優選供應商,這也反映出當前pin針市場複雜的「科技競爭生態」。
和林微納的pin針價格與台系及其他國際廠商相比存在哪些差異?
和林微納的pin針價格較台系及泰科等國際廠商低大約10%,這一成本優勢主要來源於人工成本的差異。臺灣地區的人力成本約為大陸地區的三倍,使得大陸企業能夠憑藉更低的人力支出實現同樣甚至更高的利潤率,不過海外企業通常對利潤率有着較高要求,這進一步拉大了彼此之間的價格競爭力差距,在「科技價格比拼」中呈現出不同的態勢。
和林微納目前是否已涉足GPU相關pin針業務?
其進展如何?和林微納目前已經開始涉足GPU相關pin針業務了,並且大約在11月份向英偉達(NVIDIA)送樣進行測試,這些樣品主要是提供給英偉達研發部門用於實驗室測試,不過最終能否實現量產目前尚未確定。據推測,相關測試結果可能會在3月左右公佈,其后續發展態勢備受行業關注,猶如一顆在「科技探索軌道」上待發光的新星。
其他主要廠商,如鴻騰精密和泰科,在GPUpin針領域的發展情況怎樣?
鴻騰精密和泰科也正在緊鑼密鼓地進行GPUpin針相關產品的測試工作,與和林微納類似,其送測時間集中在12月左右。就目前情況來看,由於它們不具有大陸背景,被選為供應商的概率相對較大。然而,在未來進入大規模量產階段后,爲了降低整體成本,下游客户可能會考慮引入包括和林微納在內的大陸供應商,畢竟大陸廠商在效率方面具有一定優勢,送樣進度也相對更快,有望在后續的「科技供應鏈重塑」中佔據一席之地。
大陸廠商未來在pin針領域有着怎樣的發展機會?
又面臨哪些挑戰呢?大陸廠商未來有望通過降本增效方案來獲取更多的發展機會,例如,在富士康之外,大陸地區還有華碩、緯創等擁有大量工廠資源的大型製造企業,這為國內供應鏈的引入提供了潛在的發展空間。不過,現階段由於研發資源相對有限,且前期訂單量較小,大陸企業尚未被廣泛採用作為第二供應商。短期內,要想大規模引入國內供應鏈,還需等待實際需求進一步增長以及下游客户完成初步選型之后才能實現,大陸廠商在pin針領域的發展之路可謂是機遇與挑戰並存的「科技征途」。
GB300確定要用socket了嗎?
測試結果是在3月份嗎?是的,GB300確定會採用socket,而且相關測試結果大概率會在3月份出爐。從3月份起,各ODM廠商需要着手組裝整機,並開展一系列相關測試工作,以確保能夠在5月至6月向客户提供樣機。若不能及時完成這些驗證工作,將會對整體項目進度產生較大影響。畢竟3月份之后,整機需要搭載包括pin針等諸多組件在內進行全面測試,所以測試結果的按時出爐至關重要。而且,關鍵部件的採購周期普遍較長,例如電源的採購周期約為兩個月,其他部件也基本維持在兩個月左右。此外,像超級電容(超容)等組件也需要按計劃納入整機,不過前期採購量相對較小,主要是爲了滿足5月至6月樣機和小批量生產的需求,這一系列環節都如同緊密咬合的「科技齒輪」,任何一環出現問題都可能影響整體運轉。
超級電容是否會作為標配提供給客户?
超級電容(BBU)通常作為選配項,不一定會隨樣機一同送測給客户。在未來的渠道客户中,中小型客户可能更傾向於選擇超級電容,這是因為這類客户往往缺乏對機房配置的專業判斷能力,所以選配超級電容的概率相對較高,它在不同客户需求場景下扮演着不同的「科技角色」。
大批量生產何時啟動?
大批量生產預計將在第三季度啟動,並會經歷一個逐步爬坡的階段,大致時間點落在8月至9月之間。在此之前,樣機會經過1至2個月的內部測試,然后由ODM廠商送給客户測試,大約在5月至6月完成交付,之后將於7月至8月進行內部驗證,只有通過驗證后,方可進入大規模交付階段。在ODM送測試階段,數量不會特別大,總共ODM的量可能在幾百櫃,分攤到每個ODM廠商上,估計也就是幾十櫃,而且這幾十櫃可能還要分發給不同的客户,整個過程就像是一場嚴謹有序的「科技產品孵化之旅」,每個階段都有着明確的任務和目標,以確保最終推向市場的產品質量可靠、性能卓越。
(轉自:紀要研報地)