繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

國內雲廠調研:二季度情況與H20解禁后採購計劃

2025-07-17 18:48

(來源:老司機駕新車)

1、AI雲相關收入結構及增長

·GPU租賃收入表現:GPU租賃收入呈顯著增長趨勢。一季度為15.31億元,二季度增至17.86億元,環比增速被評價為「可以的」。2024年Q4為8.15億元;2024年同期(Q1、Q2)分別為5.1億元、5.17億元,2025年Q1、Q2較2024年同期增長約三倍,同比和環比增速均在預期內,甚至超預期。

·模型收入增長邏輯:模型收入增長受定價策略、市場認可度和模型盈利狀況影響。定價上,字節模型按逐月版本覈定,近期火山引擎模型折扣審批收緊,深折扣減少,平均折扣上升;視頻生成模型基本無折扣,定價為友商可靈模型的約1/3。市場認可度方面,國內模型佔有率約40%,高調用量和認可度為不降價或優化毛利提供支持。盈利上,文本模型略虧,隨調用量增加虧損有望修正;圖像理解和視頻生成模型毛利約10%,視頻生成模型申請9折需總裁審批,低於9折會虧損。

2、雲業務毛利結構與改善

·各業務線毛利水平:基礎雲服務(CPU存儲數據庫)毛利約-12%。TPU業務虧損較一季度擴大,一季度虧損約10%,當前虧損12 -13%。GPU租賃業務毛利23.2%,未來或下降,預計Q3降至20%左右,海外B200定價會影響最終毛利。CDN、短信等流量型產品毛利持平,公司清退部分低價虧損客户,不開展不掙錢業務。AI mass業務綜合毛利約3 -4%,整體不虧損。直播點播類業務毛利從20%左右提至30%+,編解碼類、數字人業務毛利較好但規模小。數據產品如抖音用户標籤、思域數據洞察等毛利可達50-60%,公司挑客户,訂單金額有限。

3、算力租賃市場與競爭格局

·市場現狀與價格趨勢:二季度算力租賃市場毛利呈下降趨勢。因國內B200普遍未到貨,市場處於新舊卡青黃不接狀態,用户偏好B200等新卡,對A800、H100等老卡接受度低。老卡加速折舊,若企業老卡佔比過多,毛利將受影響。市場有需求但使用效果不佳,供需不均衡:大規模需求(一次性幾千張)交付緊張;小規模需求(一次十幾張或幾十張)供應充足,如租賃10張A800,現貨現款、月付模式下超10家供應商會響應。此外,部分企業因合規限制無法使用水卡。

·同行毛利對比:百度、阿里、騰訊雲在GPU租賃業務的毛利水平及經營策略存在差異。百度要求毛利30%以上才籤合同,採用6年折舊政策,通過定製產品線下交付H200租賃,雲業務營收依賴GPU租賃。阿里表內合規卡毛利約25-26%,水卡量多但毛利未知。騰訊服務器折舊政策為6年,雲業務20%的增長包含GPU租賃業務。

4、H20採購與國產卡進展

·H20訂單與交付:H20訂單交付方面,已入庫尾單約14萬張。待交付約20萬張(含騰訊等同行,騰訊待交付接近20萬張)。訂單需先預付再排隊,目前相關訂單已完成預付款,在供應商訂單排序中靠前(字節、騰訊等)。未交付訂單若無法交付則轉成B30,能交付則正常交付。短期內新訂單下單難度大,新增較少。

·國產卡供應情況:國產卡供應方面,升騰系列中,920B已入庫約2萬張,后續無新增;910C預計7月下旬小規模交付,大規模交付或至Q4,受南方廠產能良率影響,全年訂單樂觀可交付4-5萬張,不樂觀僅1-2萬張。寒武紀系列中,590因臺積電版本芯片合規問題需資源(更多實時紀要加微信:aileesir)搬遷,Q1入庫3500多臺,Q2入庫近3200台,部分延檔至Q3,Q3預計入庫約5000台;580年內採購量或達7-8千至1萬台,但節奏較慢。此外,國產芯片普遍面臨臺機版本通道受限、多數廠商未全面轉三星供貨等問題,僅崑崙系列在三星供貨方面較好。

5、資本開支與算力規劃

·25年資本開支預算:2025年全年總資本開支預算為1600 -1800億,其中AI數據中心預算為900億,分配為海外500億、國內400億。上半年CPU部分入庫約30多萬臺機器,支出接近260-270億;GPU部分海外支出330-340億,國內支出100 -150億,國內預算剩余較多。一季度支出多於二季度,預計后兩季度每季度有500億左右資本開支,全年900億的AI數據中心基礎採購預算可完成。

·未來算力需求與採購:2025年底目標為實現50萬億tokens日均調用量,預計需55-60萬張卡支持,其中70%為訓練卡(如H20、590、920B等),30%為推理卡。因算力需求增長,2026年算力開發預算或從2025年的900多億增至1400 -1500億,總CAPEX(含算力部分)將超2000億(不含組件、IDC、交換線纜設備等)。AMD卡已開始採購,預計2026年份額達10%左右,算子框架問題解決后,其與H20相比性價比尚可。英偉達特供GPU B30預計最快9-10月供貨,新方案供貨慢;性能上,FP8、FP16提升有限,FP4精度或貴士方案(機櫃內互聯通信)可能有改進,單機8卡性能提升空間不大。

Q&A

Q: 字節雲二季度收入及同比、環比增速情況如何?

A: 火山引擎24年Q2實際營收約54億,環比基本持平,同比增長約100%,去年同期營收約25-26億。

Q: 會議中提到的二十五六億具體指哪一數據?

A: 二十五六億指火山引擎去年同期收入。

Q: 火山引擎雲業務模型API收入目標調增的原因是什麼?

A: 調增主要有兩方面原因:一是模型API收入增速超預期;二是張一鳴對雲業務進行窗口指導,字節核心高層認可雲業務價值並認為模型側值得重點投入。25年年初制定雲業務營收目標時,模型收入原定2.2億,近期調增至10億。最初張一鳴在五六月份提出ToB業務年度營收目標為20億,明年目標100億,最終預計可達120億左右。

Q: 火山引擎2024年第二季度營收環比未實現顯著增長的原因是什麼?

A: 主要由於大量客户退租或到期后不再續租A800資源,其核心需求未消失,而是等待火山引擎供應海外B200資源。火山引擎計劃於7月中下旬在新加坡、柔佛等特定區域上線B200資源,以滿足米哈遊、小紅書、Mini Max智庫等客户的資源需求。隨着下半年B200及基本200資源批量交付,雲業務營收增長預計將加速。

Q: 字節雲今年全年營收目標從原計劃的212億上調至235億是否正確?

A: 該數字調整正確,今年6月字節雲將全年營收目標從212億調增至235億。

Q: 字節雲原模型收入目標為2.2億元,現上調至10億元是否為今年目標?

A: 是,今年模型收入目標上調至10億元,完成難度不大;明年目標為100億元。

Q: 過去兩個季度模型收入累計1.6億元,全年模型收入目標為何從2.2億元上調至10億元,明年目標是否計劃翻十倍至100億元?

A: 全年模型收入目標已上調至10億元,明年目標為國內加海外合計100億元,且當前海外部分收入增速較快。

Q: ToB收入是否僅指模型收入,還是包含解決方案?

A: ToB收入指模型收入及API收入。

Q: ToB業務全年20億收入目標是否指火山引擎的模型接口收入?

A: 該目標由張一鳴提出,20億為超預期目標,當前實際目標未設如此高,10億即為完成任務。

Q: 2026年模型API收入、GPU租賃收入及雲收入的目標分別是多少?

A: 2026年模型API收入目標為100億元,GPU租賃收入目標為120億元,雲收入初步目標為350億元,最終目標預計在400億元上下,近年目標要求逐年翻倍。

Q: 350億至400億的營收計劃中是否劃分了海外與國內的收入比例?

A: 若目標定為400億,海外收入預計約100億。

Q: 目前海外收入在整體收入中的佔比能否達到四分之一量級?

A: 目前未達到。整體目標為235億元,其中海外目標35億元;25年H1海外實際收入約十多億元,未完成目標。預計下半年隨着GPU租賃業務推進及GPU卡到位,海外收入將加速增長。

Q: 二季度GPU租賃業務收入情況如何?AI雲相關收入的同比及環比趨勢如何?

A: 二季度GPU租賃業務收入為17.86億,一季度為15.31億,AI雲相關總體收入為33.17億。24年Q4 GPU租賃實際完成8.15億,同比及環比增速超預期。24年同期Q1完成5.1億,Q2完成5.17億,同比增長約三倍;環比增速處於合理範圍。

Q: 字節雲二季度利潤率改善的背景下,傳統業務的毛利情況如何?

A: 基礎IaaS業務處於虧損狀態,其中CPU、存儲、數據庫中間件的毛利約為-12個百分點。

Q: 基礎 IaaS 的毛利與一季度相比是否一致?

A: 基礎IaaS中,TPU業務二季度虧損幅度較一季度擴大,主要因大客户搬遷導致折扣力度較大及成本上升,虧損率從一季度的約10個點擴大至12-13個點;GPU業務二季度毛利率為23.2%。

Q: 二季度公司利潤率改善的主要驅動因素是否包括傳統CPU業務毛利下降、GPU租賃未增長、虧損CDN項目削減及AI mass層毛利率提升?

A: 二季度利潤率改善的驅動因素不僅包括上述提及的內容,還涉及其他業務:直播點播、媒體雲等業務毛利顯著提升,其中直播點播類業務毛利率從20多個百分點提升至30多個百分點;點播、編解碼類業務毛利表現良好,數字人業務毛利尚可但規模較小;此外,數據產品毛利率高達50%-60%,但因嚴格篩選客户,訂單金額有限,增長速度較慢。

Q: 直播點播、媒體雲、編解碼類、數字人及數據產品等業務是否屬於PaaS層服務?

A: 當前這些業務基本屬於PaaS組件。

Q: 二季度算力租賃市場的毛利水平及趨勢如何?

A: 二季度算力租賃市場毛利呈下降趨勢。主要因國內B200芯片普遍未到貨,市場處於青黃不接狀態,客户需求集中轉向B200但供應不足,導致租賃市場報價與成交價均值快速下降。同時,老卡佔比過高引發加速折舊,進一步拉低毛利。當前僅B200到貨或能補充毛利,而國長卡收入基本可忽略,僅華為升騰、百度崑崙等部分國產卡表現尚可;沐曦、天速等卡對外租賃困難,主要用於智算場景但實際使用效果有限。

Q: 二季度百度雲與阿里雲GPU租賃業務的毛利預計處於什麼水平?

A: 二季度百度雲GPU租賃業務要求合同毛利不低於30%,其設備採用6年折舊政策。騰訊雲服務器折舊政策調整為6年,且其今年20%的增長可能部分來源於GPU租賃業務收入。

Q: 阿里GPU租賃業務的毛利情況如何?

A: 阿里GPU租賃業務毛利約25-26個百分點,高於我們但幅度有限。其表內業務以合規卡為主,表外水卡業務規模較大,但水卡業務毛利難以測算。參考百度經驗,百度通過定製產品實現線下交付,其雲業務當前280億營收同樣依賴GPU業務。

Q: H20禁售后,市場普遍預期GPU供不應求或算力緊缺,但實際觀察到水卡供應較多且用户不願使用老(更多實時紀要加微信:aileesir)卡,是否存在這種情況?

A: 實際情況呈現供需不均衡特徵:大規模需求仍存在緊張,但小規模需求供應充足,供應商數量多;部分公司稱卡緊張主要因不敢使用水卡,而非國內實際卡量短缺。

Q: H20恢復銷售后,字節的採購計劃及到貨節奏如何?

A: H20訂單由字節統一下單而非字節雲。當前字節仍有約20萬張H20訂單未交付且未撤單,約定若無法交付則轉為B30訂單,可交付則正常交付。短期內新下單難度較大。英偉達3月傳遞信息顯示,年內可能推出B30、GV30等更優版本,H20解禁或預示此類升級版本將推出。此外,若H20恢復銷售,HBM或可在國內部分正常交易,后續H20的下一代平替版本及櫃式整機方案值得關注。H20本身討論較少,尾單將正常交付。

Q: 一季度提及的H20年度計劃20萬張訂單,目前已交付多少張?提及的尾單數量具體是多少?

A: H20尾單實際入庫約14萬張,后續待交付訂單約20萬張;騰訊也有接近20萬張的X20訂單處於待交付狀態。

Q: 尾單14萬張與待交付20萬張之間的關係是什麼?

A: 尾單14萬張為已實際入庫的訂單量,待交付20萬張為已預付訂單款但尚未完成交付的訂單量。向供應商採購顯卡需先預付訂單款,公司已為H20卡等產品預付全部款項並進入排隊交付流程,因此包括公司、字節、騰訊在內的客户待交付訂單在供應商處排序較前。當前存在因經營原因未交付的已付訂單,后續可能根據情況轉為B30或依賴X20供應。

Q: 當前在手的H20數量及已付款未交付的H20數量分別是多少?

A: 快手的H20去年為27張,今年為14張,整體待交付的H20數量約20多萬張。

Q: NV 卡的儲備量及國產卡的儲備與今年新增情況如何?

A: Q2國產芯片製程與工藝改善有限,920C芯片供應預計於Q3開始小規模供應,但初期供應量不大。國產芯片普遍面臨臺機版本通道不暢問題,多數廠商未全面轉向三星獲取芯片,當前三星主要為崑崙供貨且供應情況良好。關於今年國產卡的現狀,當前未進一步明確説明。

Q: 今年國產卡的類型及數量情況如何?

A: 今年國內主要採購的國產卡類型及數量情況如下:升騰920B已入庫約2萬張,后續無新增採購;910C計劃於7月下旬開始小規模交付,大規模交付預計在Q4,主要受南方廠產能良率不及預期影響;920C今年訂單量為4-5萬張,樂觀情況下可整體交付,不樂觀則僅能交付約1-2萬張,主要因卡生產問題;寒武紀5900卡因BIS範圍鑑定調整,臺積電版本芯片被認定不合規,無法入庫自由税中心,當前正搬遷線上590機器,下線已上架設備並進行資源整合及合規調整。

Q: 寒武紀590卡當前入庫情況如何?

A: 寒武紀590卡Q1入庫3500多臺,Q2入庫約3200台,部分機器延檔至Q3;Q3預計入庫5000多臺,Q4入庫情況視供貨節奏而定。此外,寒武紀因銷售調整僅服務有限大客户,當前獲取的590卡為臺機版本,其國產版本未進一步量產;580卡今年預計採購7000-10000張,但進度較慢。

Q: 今年AI數據中心900億採購預算是否受H20禁售或恢復影響,且預算分配是否仍為海外500億、國內400億?

A: 今年AI數據中心900億採購預算不受H20禁售或恢復影響,資金可正常支出,預算分配仍為海外500億、國內400億。

Q: 明年AI數據中心資本開支計劃是否會從900億上升至1400-1500億,進而帶動整體資本開支達到2000億規模?

A: 今年算力部分資本開支預計超過2000億,且該規模不包含組件、IDC、交換線纜設備等相關支出。

Q: 一季度與二季度的資本開支投入金額分別為多少?

A: CPU方面,投入約260-270億元;GPU方面,海外部分投入約330-340億元,國內部分投入約140-150億元,國內預算剩余較多。此外,年底可能因天數B200等芯片需求增加預算。

Q: 上半年總支出約六七百億元,其中海外部分約三百億元,季度間支出變化情況如何?一季度與二季度支出是否存在差異?

A: 上半年支出呈現季度差異,一季度支出較多,二季度支出較少。

Q: 年底計劃實現50萬億tokens的日均調用量,需要多大算力支持該調用量?

A: 支持該調用量需要55萬至60萬張卡,其中70%為訓練卡,30%為推理卡。

Q: 目前GPU資源中訓練與推理的分配情況如何?

A: 目前線上GPU卡總量約50多萬張,字節日均交易量18萬億至20萬億。20萬TOKEN對應約23萬張卡,其中50%用於文本模態,50%用於圖像理解、視頻生成和多模態。當前23萬張卡中40%為L20,60%為H20、590等訓練卡用於推理需求。預計年底多模態比例將增加,訓練所需算力佔比也將進一步提升。

Q: 當前訓練卡與推理卡的比例是否為6:4?

A: 當前訓練卡佔比已達60%左右,涉及的訓練卡類型包括A800、590、H20等。

Q: 當前用於內部使用的卡數量是否為23萬張?對外使用及出租的卡數量情況如何?

A: 字節所有模型推理所需芯片由方舟統一算力調度平臺管理,外部用卡數量可通過內外部TOKEN使用比例估算。火山引擎對外出租的卡總量較高,具體包括:H20約6萬-7萬張、A800約2萬多張;海外部分有H800約1萬張、H200約六七千張,以及即將對外出租的B200約5000-6000張。

Q: 英偉達恢復H20銷售並計劃推出特供GPU后,市場等待產品參數及定價以制定后續採購計劃,預計特供GPU的具體信息發佈時間及出貨時間如何?是否需等到四季度或明年?

A: B30供應最快可能在9-10月,主要因需再次改配工程樣機。考慮到英偉達H20此前供貨多次延迟的情況,其承諾的交期可信度較低,實際出貨時間可能進一步延后,不會很快。

Q: H20待交付的20萬張今年能否到貨,新方案的交付節奏是否較慢?

A: H20待交付的20萬張預計近兩個月可交付完畢,新方案交付節奏較慢,需等待更長時間。

Q: H20待交付的20萬張今年能否完成到貨?新方案的交付進度是否較慢?

A: H20預計近兩個月可完成交付,新方案交付進度較慢,需等待更長時間。

Q: AMD MI 300系列芯片今年是否已啟動採購?后續方案中預計能佔據英偉達多少份額?

A: AMD MI 300系(更多實時紀要加微信:aileesir)列芯片已啟動採購,可通過供應鏈上下游驗證。預計明年AMD將佔據約10%的英偉達份額。

Q: 公司內部是否對MI300芯片開展研究或測試?其與H20芯片相比的性價比如何?

A: MI300芯片與H20芯片相比當前性價比表現尚可,且在算子框架問題解決后性能表現良好。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。