简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

国内云厂调研:二季度情况与H20解禁后采购计划

2025-07-17 18:48

(来源:老司机驾新车)

1、AI云相关收入结构及增长

·GPU租赁收入表现:GPU租赁收入呈显著增长趋势。一季度为15.31亿元,二季度增至17.86亿元,环比增速被评价为“可以的”。2024年Q4为8.15亿元;2024年同期(Q1、Q2)分别为5.1亿元、5.17亿元,2025年Q1、Q2较2024年同期增长约三倍,同比和环比增速均在预期内,甚至超预期。

·模型收入增长逻辑:模型收入增长受定价策略、市场认可度和模型盈利状况影响。定价上,字节模型按逐月版本核定,近期火山引擎模型折扣审批收紧,深折扣减少,平均折扣上升;视频生成模型基本无折扣,定价为友商可灵模型的约1/3。市场认可度方面,国内模型占有率约40%,高调用量和认可度为不降价或优化毛利提供支持。盈利上,文本模型略亏,随调用量增加亏损有望修正;图像理解和视频生成模型毛利约10%,视频生成模型申请9折需总裁审批,低于9折会亏损。

2、云业务毛利结构与改善

·各业务线毛利水平:基础云服务(CPU存储数据库)毛利约-12%。TPU业务亏损较一季度扩大,一季度亏损约10%,当前亏损12 -13%。GPU租赁业务毛利23.2%,未来或下降,预计Q3降至20%左右,海外B200定价会影响最终毛利。CDN、短信等流量型产品毛利持平,公司清退部分低价亏损客户,不开展不挣钱业务。AI mass业务综合毛利约3 -4%,整体不亏损。直播点播类业务毛利从20%左右提至30%+,编解码类、数字人业务毛利较好但规模小。数据产品如抖音用户标签、思域数据洞察等毛利可达50-60%,公司挑客户,订单金额有限。

3、算力租赁市场与竞争格局

·市场现状与价格趋势:二季度算力租赁市场毛利呈下降趋势。因国内B200普遍未到货,市场处于新旧卡青黄不接状态,用户偏好B200等新卡,对A800、H100等老卡接受度低。老卡加速折旧,若企业老卡占比过多,毛利将受影响。市场有需求但使用效果不佳,供需不均衡:大规模需求(一次性几千张)交付紧张;小规模需求(一次十几张或几十张)供应充足,如租赁10张A800,现货现款、月付模式下超10家供应商会响应。此外,部分企业因合规限制无法使用水卡。

·同行毛利对比:百度、阿里、腾讯云在GPU租赁业务的毛利水平及经营策略存在差异。百度要求毛利30%以上才签合同,采用6年折旧政策,通过定制产品线下交付H200租赁,云业务营收依赖GPU租赁。阿里表内合规卡毛利约25-26%,水卡量多但毛利未知。腾讯服务器折旧政策为6年,云业务20%的增长包含GPU租赁业务。

4、H20采购与国产卡进展

·H20订单与交付:H20订单交付方面,已入库尾单约14万张。待交付约20万张(含腾讯等同行,腾讯待交付接近20万张)。订单需先预付再排队,目前相关订单已完成预付款,在供应商订单排序中靠前(字节、腾讯等)。未交付订单若无法交付则转成B30,能交付则正常交付。短期内新订单下单难度大,新增较少。

·国产卡供应情况:国产卡供应方面,升腾系列中,920B已入库约2万张,后续无新增;910C预计7月下旬小规模交付,大规模交付或至Q4,受南方厂产能良率影响,全年订单乐观可交付4-5万张,不乐观仅1-2万张。寒武纪系列中,590因台积电版本芯片合规问题需资源(更多实时纪要加微信:aileesir)搬迁,Q1入库3500多台,Q2入库近3200台,部分延档至Q3,Q3预计入库约5000台;580年内采购量或达7-8千至1万台,但节奏较慢。此外,国产芯片普遍面临台机版本通道受限、多数厂商未全面转三星供货等问题,仅昆仑系列在三星供货方面较好。

5、资本开支与算力规划

·25年资本开支预算:2025年全年总资本开支预算为1600 -1800亿,其中AI数据中心预算为900亿,分配为海外500亿、国内400亿。上半年CPU部分入库约30多万台机器,支出接近260-270亿;GPU部分海外支出330-340亿,国内支出100 -150亿,国内预算剩余较多。一季度支出多于二季度,预计后两季度每季度有500亿左右资本开支,全年900亿的AI数据中心基础采购预算可完成。

·未来算力需求与采购:2025年底目标为实现50万亿tokens日均调用量,预计需55-60万张卡支持,其中70%为训练卡(如H20、590、920B等),30%为推理卡。因算力需求增长,2026年算力开发预算或从2025年的900多亿增至1400 -1500亿,总CAPEX(含算力部分)将超2000亿(不含组件、IDC、交换线缆设备等)。AMD卡已开始采购,预计2026年份额达10%左右,算子框架问题解决后,其与H20相比性价比尚可。英伟达特供GPU B30预计最快9-10月供货,新方案供货慢;性能上,FP8、FP16提升有限,FP4精度或贵士方案(机柜内互联通信)可能有改进,单机8卡性能提升空间不大。

Q&A

Q: 字节云二季度收入及同比、环比增速情况如何?

A: 火山引擎24年Q2实际营收约54亿,环比基本持平,同比增长约100%,去年同期营收约25-26亿。

Q: 会议中提到的二十五六亿具体指哪一数据?

A: 二十五六亿指火山引擎去年同期收入。

Q: 火山引擎云业务模型API收入目标调增的原因是什么?

A: 调增主要有两方面原因:一是模型API收入增速超预期;二是张一鸣对云业务进行窗口指导,字节核心高层认可云业务价值并认为模型侧值得重点投入。25年年初制定云业务营收目标时,模型收入原定2.2亿,近期调增至10亿。最初张一鸣在五六月份提出ToB业务年度营收目标为20亿,明年目标100亿,最终预计可达120亿左右。

Q: 火山引擎2024年第二季度营收环比未实现显著增长的原因是什么?

A: 主要由于大量客户退租或到期后不再续租A800资源,其核心需求未消失,而是等待火山引擎供应海外B200资源。火山引擎计划于7月中下旬在新加坡、柔佛等特定区域上线B200资源,以满足米哈游、小红书、Mini Max智库等客户的资源需求。随着下半年B200及基本200资源批量交付,云业务营收增长预计将加速。

Q: 字节云今年全年营收目标从原计划的212亿上调至235亿是否正确?

A: 该数字调整正确,今年6月字节云将全年营收目标从212亿调增至235亿。

Q: 字节云原模型收入目标为2.2亿元,现上调至10亿元是否为今年目标?

A: 是,今年模型收入目标上调至10亿元,完成难度不大;明年目标为100亿元。

Q: 过去两个季度模型收入累计1.6亿元,全年模型收入目标为何从2.2亿元上调至10亿元,明年目标是否计划翻十倍至100亿元?

A: 全年模型收入目标已上调至10亿元,明年目标为国内加海外合计100亿元,且当前海外部分收入增速较快。

Q: ToB收入是否仅指模型收入,还是包含解决方案?

A: ToB收入指模型收入及API收入。

Q: ToB业务全年20亿收入目标是否指火山引擎的模型接口收入?

A: 该目标由张一鸣提出,20亿为超预期目标,当前实际目标未设如此高,10亿即为完成任务。

Q: 2026年模型API收入、GPU租赁收入及云收入的目标分别是多少?

A: 2026年模型API收入目标为100亿元,GPU租赁收入目标为120亿元,云收入初步目标为350亿元,最终目标预计在400亿元上下,近年目标要求逐年翻倍。

Q: 350亿至400亿的营收计划中是否划分了海外与国内的收入比例?

A: 若目标定为400亿,海外收入预计约100亿。

Q: 目前海外收入在整体收入中的占比能否达到四分之一量级?

A: 目前未达到。整体目标为235亿元,其中海外目标35亿元;25年H1海外实际收入约十多亿元,未完成目标。预计下半年随着GPU租赁业务推进及GPU卡到位,海外收入将加速增长。

Q: 二季度GPU租赁业务收入情况如何?AI云相关收入的同比及环比趋势如何?

A: 二季度GPU租赁业务收入为17.86亿,一季度为15.31亿,AI云相关总体收入为33.17亿。24年Q4 GPU租赁实际完成8.15亿,同比及环比增速超预期。24年同期Q1完成5.1亿,Q2完成5.17亿,同比增长约三倍;环比增速处于合理范围。

Q: 字节云二季度利润率改善的背景下,传统业务的毛利情况如何?

A: 基础IaaS业务处于亏损状态,其中CPU、存储、数据库中间件的毛利约为-12个百分点。

Q: 基础 IaaS 的毛利与一季度相比是否一致?

A: 基础IaaS中,TPU业务二季度亏损幅度较一季度扩大,主要因大客户搬迁导致折扣力度较大及成本上升,亏损率从一季度的约10个点扩大至12-13个点;GPU业务二季度毛利率为23.2%。

Q: 二季度公司利润率改善的主要驱动因素是否包括传统CPU业务毛利下降、GPU租赁未增长、亏损CDN项目削减及AI mass层毛利率提升?

A: 二季度利润率改善的驱动因素不仅包括上述提及的内容,还涉及其他业务:直播点播、媒体云等业务毛利显著提升,其中直播点播类业务毛利率从20多个百分点提升至30多个百分点;点播、编解码类业务毛利表现良好,数字人业务毛利尚可但规模较小;此外,数据产品毛利率高达50%-60%,但因严格筛选客户,订单金额有限,增长速度较慢。

Q: 直播点播、媒体云、编解码类、数字人及数据产品等业务是否属于PaaS层服务?

A: 当前这些业务基本属于PaaS组件。

Q: 二季度算力租赁市场的毛利水平及趋势如何?

A: 二季度算力租赁市场毛利呈下降趋势。主要因国内B200芯片普遍未到货,市场处于青黄不接状态,客户需求集中转向B200但供应不足,导致租赁市场报价与成交价均值快速下降。同时,老卡占比过高引发加速折旧,进一步拉低毛利。当前仅B200到货或能补充毛利,而国长卡收入基本可忽略,仅华为升腾、百度昆仑等部分国产卡表现尚可;沐曦、天速等卡对外租赁困难,主要用于智算场景但实际使用效果有限。

Q: 二季度百度云与阿里云GPU租赁业务的毛利预计处于什么水平?

A: 二季度百度云GPU租赁业务要求合同毛利不低于30%,其设备采用6年折旧政策。腾讯云服务器折旧政策调整为6年,且其今年20%的增长可能部分来源于GPU租赁业务收入。

Q: 阿里GPU租赁业务的毛利情况如何?

A: 阿里GPU租赁业务毛利约25-26个百分点,高于我们但幅度有限。其表内业务以合规卡为主,表外水卡业务规模较大,但水卡业务毛利难以测算。参考百度经验,百度通过定制产品实现线下交付,其云业务当前280亿营收同样依赖GPU业务。

Q: H20禁售后,市场普遍预期GPU供不应求或算力紧缺,但实际观察到水卡供应较多且用户不愿使用老(更多实时纪要加微信:aileesir)卡,是否存在这种情况?

A: 实际情况呈现供需不均衡特征:大规模需求仍存在紧张,但小规模需求供应充足,供应商数量多;部分公司称卡紧张主要因不敢使用水卡,而非国内实际卡量短缺。

Q: H20恢复销售后,字节的采购计划及到货节奏如何?

A: H20订单由字节统一下单而非字节云。当前字节仍有约20万张H20订单未交付且未撤单,约定若无法交付则转为B30订单,可交付则正常交付。短期内新下单难度较大。英伟达3月传递信息显示,年内可能推出B30、GV30等更优版本,H20解禁或预示此类升级版本将推出。此外,若H20恢复销售,HBM或可在国内部分正常交易,后续H20的下一代平替版本及柜式整机方案值得关注。H20本身讨论较少,尾单将正常交付。

Q: 一季度提及的H20年度计划20万张订单,目前已交付多少张?提及的尾单数量具体是多少?

A: H20尾单实际入库约14万张,后续待交付订单约20万张;腾讯也有接近20万张的X20订单处于待交付状态。

Q: 尾单14万张与待交付20万张之间的关系是什么?

A: 尾单14万张为已实际入库的订单量,待交付20万张为已预付订单款但尚未完成交付的订单量。向供应商采购显卡需先预付订单款,公司已为H20卡等产品预付全部款项并进入排队交付流程,因此包括公司、字节、腾讯在内的客户待交付订单在供应商处排序较前。当前存在因经营原因未交付的已付订单,后续可能根据情况转为B30或依赖X20供应。

Q: 当前在手的H20数量及已付款未交付的H20数量分别是多少?

A: 快手的H20去年为27张,今年为14张,整体待交付的H20数量约20多万张。

Q: NV 卡的储备量及国产卡的储备与今年新增情况如何?

A: Q2国产芯片制程与工艺改善有限,920C芯片供应预计于Q3开始小规模供应,但初期供应量不大。国产芯片普遍面临台机版本通道不畅问题,多数厂商未全面转向三星获取芯片,当前三星主要为昆仑供货且供应情况良好。关于今年国产卡的现状,当前未进一步明确说明。

Q: 今年国产卡的类型及数量情况如何?

A: 今年国内主要采购的国产卡类型及数量情况如下:升腾920B已入库约2万张,后续无新增采购;910C计划于7月下旬开始小规模交付,大规模交付预计在Q4,主要受南方厂产能良率不及预期影响;920C今年订单量为4-5万张,乐观情况下可整体交付,不乐观则仅能交付约1-2万张,主要因卡生产问题;寒武纪5900卡因BIS范围鉴定调整,台积电版本芯片被认定不合规,无法入库自由税中心,当前正搬迁线上590机器,下线已上架设备并进行资源整合及合规调整。

Q: 寒武纪590卡当前入库情况如何?

A: 寒武纪590卡Q1入库3500多台,Q2入库约3200台,部分机器延档至Q3;Q3预计入库5000多台,Q4入库情况视供货节奏而定。此外,寒武纪因销售调整仅服务有限大客户,当前获取的590卡为台机版本,其国产版本未进一步量产;580卡今年预计采购7000-10000张,但进度较慢。

Q: 今年AI数据中心900亿采购预算是否受H20禁售或恢复影响,且预算分配是否仍为海外500亿、国内400亿?

A: 今年AI数据中心900亿采购预算不受H20禁售或恢复影响,资金可正常支出,预算分配仍为海外500亿、国内400亿。

Q: 明年AI数据中心资本开支计划是否会从900亿上升至1400-1500亿,进而带动整体资本开支达到2000亿规模?

A: 今年算力部分资本开支预计超过2000亿,且该规模不包含组件、IDC、交换线缆设备等相关支出。

Q: 一季度与二季度的资本开支投入金额分别为多少?

A: CPU方面,投入约260-270亿元;GPU方面,海外部分投入约330-340亿元,国内部分投入约140-150亿元,国内预算剩余较多。此外,年底可能因天数B200等芯片需求增加预算。

Q: 上半年总支出约六七百亿元,其中海外部分约三百亿元,季度间支出变化情况如何?一季度与二季度支出是否存在差异?

A: 上半年支出呈现季度差异,一季度支出较多,二季度支出较少。

Q: 年底计划实现50万亿tokens的日均调用量,需要多大算力支持该调用量?

A: 支持该调用量需要55万至60万张卡,其中70%为训练卡,30%为推理卡。

Q: 目前GPU资源中训练与推理的分配情况如何?

A: 目前线上GPU卡总量约50多万张,字节日均交易量18万亿至20万亿。20万TOKEN对应约23万张卡,其中50%用于文本模态,50%用于图像理解、视频生成和多模态。当前23万张卡中40%为L20,60%为H20、590等训练卡用于推理需求。预计年底多模态比例将增加,训练所需算力占比也将进一步提升。

Q: 当前训练卡与推理卡的比例是否为6:4?

A: 当前训练卡占比已达60%左右,涉及的训练卡类型包括A800、590、H20等。

Q: 当前用于内部使用的卡数量是否为23万张?对外使用及出租的卡数量情况如何?

A: 字节所有模型推理所需芯片由方舟统一算力调度平台管理,外部用卡数量可通过内外部TOKEN使用比例估算。火山引擎对外出租的卡总量较高,具体包括:H20约6万-7万张、A800约2万多张;海外部分有H800约1万张、H200约六七千张,以及即将对外出租的B200约5000-6000张。

Q: 英伟达恢复H20销售并计划推出特供GPU后,市场等待产品参数及定价以制定后续采购计划,预计特供GPU的具体信息发布时间及出货时间如何?是否需等到四季度或明年?

A: B30供应最快可能在9-10月,主要因需再次改配工程样机。考虑到英伟达H20此前供货多次延迟的情况,其承诺的交期可信度较低,实际出货时间可能进一步延后,不会很快。

Q: H20待交付的20万张今年能否到货,新方案的交付节奏是否较慢?

A: H20待交付的20万张预计近两个月可交付完毕,新方案交付节奏较慢,需等待更长时间。

Q: H20待交付的20万张今年能否完成到货?新方案的交付进度是否较慢?

A: H20预计近两个月可完成交付,新方案交付进度较慢,需等待更长时间。

Q: AMD MI 300系列芯片今年是否已启动采购?后续方案中预计能占据英伟达多少份额?

A: AMD MI 300系(更多实时纪要加微信:aileesir)列芯片已启动采购,可通过供应链上下游验证。预计明年AMD将占据约10%的英伟达份额。

Q: 公司内部是否对MI300芯片开展研究或测试?其与H20芯片相比的性价比如何?

A: MI300芯片与H20芯片相比当前性价比表现尚可,且在算子框架问题解决后性能表现良好。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。