简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

寒武纪26年空间怎么看

2025-08-13 21:05

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:纪要研报地)

说到寒武纪一直是我们重点推荐和跟踪的标的。最近这几天寒武纪股价表现非常不错,昨天上涨非常明显;这反映了市场预期的变化。之前市场对寒武纪26年的预期是看不清的,所以大家一直不太愿意给26年切换估值。但随着最近寒武纪基本面的变化,寒武纪26年预期逐渐清晰;加上现在已到8月中旬,市场也逐渐开始切换对寒武纪明年业绩的估值。当然也伴随着国内外地缘政治变化等加强因素。随着寒武纪690等新芯片架构出现,寒武纪产品、基本面也会出现积极变化;这是我们今天早晨主要探讨的。

讨论寒武纪最重要的点应该是其竞争格局。站在一年半以前即24年初的时间点看整个国产AI芯片市场,格局比现在或26年要简单得多。在23年年初时,真正能落地、能组成小集群使用的,其实只有华为昇腾与寒武纪两家。现在或展望26年,像海光这样的重要龙头也成功实现了回片,并在数据中心客户中有实际出货。

以燧原、沐曦为代表的国产AI芯片厂商也与以腾讯为代表的互联网公司有了更多商务绑定关系。格局上出现新变化;包括以阿里为代表的国产互联网厂商也慢慢开始使用自研芯片来解决实际生成式AI推理问题。整个竞争格局相较一年半前变得更复杂,绑定关系也更复杂。

大客户绑定的国产AI芯片厂商相较一年半前已有变化。对于寒武纪这样较单一的AI芯片公司,其空间在竞争格局上会比之前复杂一点。同时另一方面我们看到,包括WIC等很多厂商也参与进来。在暂时没有switch ASIC的情况下,假设不看CM386、3384这类通过光模块实现超点方案;我们认为在没有switch ID的情况下,各家做单机柜超级点效率上都有一定折扣。

在互联领域,没有switch ASIC情况下,大部分厂商还是以硬拓普为主;所谓硬拓普即一台服务器有8张卡,一张卡通过PCB类似飞7根线到另外7张卡。拓扑更复杂,确实绕过了之前PCIe总线的带宽限制;但总的来说,各家技术差异也在慢慢变小。

再看技术路线,不管是NPU、GPU还是TPU,都在慢慢趋同。做NPU的厂商如昇腾,下一代产品可能向GPGPU架构靠拢;传统做GPU的厂商可能在其产品中加入DSA,类似通过ISIC方式加强矩阵计算或AI计算能力。TPU厂商也会把TPU核心越做越小,像GPU一样在算力分配上有较平滑表现;所以各家无论技术还是产品差异都在变小,格局确实会更复杂。当然,对于单一AI芯片厂商,能绑定一到两家大客户的情况下空间还是能有不错增长;这是竞争格局。

第二个重要问题是需求,即国内厂商到底需要什么。特别明显的一点可以从TOKEN消耗结构展开。字节在6月份公开新闻显示其日均TOKEN消耗达到16.4万亿;差不多同时Google在5月披露其月均TOKEN调用约48万亿,日均也是16万亿。两者日均消耗接近;但结构上国内海外有一定差异。

Google无论是通过搜索网页做AI搜索,还是通过Gemini API做搜索,或通过编程agent调用Gemini 2.5,用的都是尺寸较大的模型。国内厂商模型上则更灵活。根据TOKEN消耗调研,国内厂商约1/3以抖音APP为主,1/3是其他APP,1/3是豆包和火山引擎调用;对重点大客户来说需求更多样化。

Google来说更多需要计算卡组64卡、128卡甚至256卡的rack小集群完成推理任务。对国内重点大客户需求更多样;单卡也许可完成计算,因为有些APP后端接的模型,如审核、推荐相关的图片理解、视觉理解、视频理解模型,大小就3B、5B或十几B,相较于动辄几百B的文字类模型参数量小很多;所以能在单卡上跑。有些文字类模型参数量也没那么大,可能几十B或100B出头,用8卡服务器也能正常部署。换言之,对国内重点大客户可能不再需要所有都组成小集群,单卡或多卡也能跑。

普通PCIe卡也能满足很大部分推理需求。对国内大客户,国产卡首先落地在其TOKEN消耗结构那三个1/3上,优先在抖音的1/3及其他如懂车帝等APP的1/3上面;这部分相对更适合用单卡或虚拟化出的4卡、8卡做实际推理工作。国产卡在单卡或8卡走PCIe总线,性价比或效率并不很落后于带SuperPOD的英伟达卡;国产卡有一定适用性。需求端看,不一定要强求超级点或很强集群化能力;几十B或几B的模型也不一定需要。这是需求端特点,也是与海外如Google这种既用GPU又用TPU厂商的差异点;国内模型参数量相对少,TOKEN消耗结构也与海外有差异。这是需求端情况。

再看供给端,格局和经济上也有变化。对国内来说,等效7纳米的N+2产能一直是中芯国际与华虹半导体两家;华虹的N+2产能偏稳定,中芯国际还在持续扩张。大部分产能给到手机SoC和一些CPU;国产AI芯片现在基数不大,随着扩产进行,留给国产AI芯片的供给量还是有较大弹性。假设抽2K-3K给国产芯片也完全够用。

5月以来我们对国内AI芯片做跟踪,5月以来没再跟踪到台积电或三星的回片;随着宏观情况演变,拥有N+2产能的国产AI芯片厂商会有更大竞争优势。N+2等效7纳米肯定有自身不足,包括良率、产品一致性上还有提高空间;但结合需求端看,有时卡不一定要非常稳定去做大集群。N+2工艺下单卡或单台服务器8卡间,有硬拓普情况下也能满足很大部分国内推理需求。供给端第一性能上能跟上;第二产能上抽2K-3K给国产AI芯片也完全能满足,毕竟中芯国际扩产还在进行。这是供给端情况。

目前看25年,大家预期慢慢趋向一致;无论供应链还是与机构交流,预期收窄在区间内。根据公开报表存货及卡BOM成本对毛利率反向测算,寒武纪库存规模约20万张量级。服务器这边长期跟踪,根据服务器及合作伙伴出货量判断;对重点大客户今年AI芯片高端型号出货量应在13万到15万张之间,加上中低端配套PCIe卡出货,构成全年对重点大客户出货。现在25年大家预期或供应链预期在慢慢收窄。

重点看寒武纪应该聚焦估值问题;估值问题隐含的还是26年预期怎么给。26年确定性最高的是其大客户资本开支;公开新闻报道其重点大客户字节25年总资本开支盘子约1600-1700亿,其中投给AI的可能1000-1100亿。到明年伴随IC业务、Mac业务持续增长,整个资本开支应会继续向上,投在AI这边可能1000-1100亿甚至更高,带自身增长率。且随着竞争格局变化,英伟达新RTX6000和B30对H20的期待;新英伟达卡没有NVLink,只有NVLink Bridge,还是要走PCI总线,没有8卡直接互联,通过点对点NVLink Bridge连接;在做集群化时优势不大,只是软件更成熟。价格上因无HBM,BOM成本、售价会低点但也仅此而已。

看超级点性能或单卡、8卡做推理性能,与国产卡差异没那么大。随着下一代产品持续迭代,比如现在最小资源单元是其Tensor Processor;随着TP不断优化,之前对ISIC架构诟病较多的显存读取问题、互联时显存访问通信问题都能较好解决。下一代我们姑且称690,其整T7计算能力提高,TP数量可能变化增多;增多TP也是向GPU靠拢表现。TP缓存管理更优化,面对单卡或8卡场景会有更优异表现。

刚讲25年预期时提到,现在这代称590,通过存货毛利率反算约20万张量级存货;今年出货完毕留给26年约10万张量级库存。单价根据产业链跟踪在6-7万之间。低端PCI卡出货量可能对标A10或T4库存,可能在10到20万量级,单价约2.5万量级。新一代芯片从成本上讲增长幅度有限,从需求端讲定价上也不会比这代高出特别多,可能在8-10万量级。出货量上中性假设与乐观假设差异较大;偏中性假设可能15万左右,乐观看可能更多。

目前看新一代芯片约700平方毫米左右;加上冗余设计后,在国产产业上良率假设700平方毫米芯片良率能到20%左右;因冗余设计不能完全按普通良率模型拍,良率能提高。一张12英寸Wafer大概割十五六颗;假设有2K到3K月产能,最大供给能力一个月也能有稳定20K到30K出货量。所以不太需担心明年国产产能下新一代称690的供给问题。加上需求端分析,很大部分TOKEN消耗能用单卡或8卡推理方案解决,不需依赖64卡、128卡甚至256卡小集群;国产芯片也能满足需求。

所以慢慢从25年切换到26年估值后,整个空间能有更大想象空间;空间确定性也在不断提高。展望26年寒武纪整体上还是相对乐观趋势。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。