简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

【券商聚焦】伯恩斯坦更新中国AI推理利润率模型 关注DeepSeek-V4与腾讯进展

2026-04-28 23:53

金吾财讯 | 伯恩斯坦(Bernstein)于2026年4月27日发布研报,更新其中国互联网AI token经济学模型,基于来自中国头部AI实验室的反馈调整关键假设,并对DeepSeek-V4及腾讯hy3-preview模型进行点评。研报覆盖的主要个股评级包括腾讯控股(00700)为“跑赢大盘”,目标价780港元;阿里巴巴(BABA/09988)为“跑赢大盘”,目标价180美元/176港元;拼多多(PDD)为“与大市同步”,目标价132美元;美团为“与大市同步”,目标价85港元;网易(NTES)为“跑赢大盘”,目标价150美元;BOSS直聘(BZ)为“与大市同步”,目标价16.5美元;京东(JD)为“跑赢大盘”,目标价36美元。

研报核心聚焦推理利润率模型调整。根据Minimax指引,其M2.7模型的文本/编码推理毛利率约为40%,这一数据促使伯恩斯坦大幅上调了每秒token吞吐量(TPS)假设。更新后模型假设M2.7的每GPU TPS为9000 tok/s,利用率90%,GPU每小时成本1.6美元,对应推理成本为每百万token 0.05美元,在假设20%商业折扣后,M2.7推理毛利率为42.5%。相比之下,Z.ai的GLM-5模型每GPU TPS为1800 tok/s,推理成本每百万token 0.31美元,毛利率33.9%;GLM-5.1模型TPS为2000 tok/s,毛利率50.3%。伯恩斯坦指出,尽管Minimax的TPS远高于Z.ai,但考虑活跃参数规模与TPS的负相关关系,Z.ai的前沿模型在同等折扣下仍可能拥有更高利润率。 

多模态推理是利润率更高的细分领域。Minimax证实其多模态工作负载(如视频生成、文本转语音)的每百万token收入(Rev/Mtok)显著高于文本/编码,例如Hailuo视频生成512p 6s的Rev/Mtok约为12美元,而文本/编码约0.15美元。2026年以来,受OpenClaw及通用智能体AI需求激增推动,文本/编码工作负载占增量增长更大部分。研报认为,轻量低成本模型市场的价格竞争将保持激烈,而前沿智能模型仍可维持一定定价能力。 

关于DeepSeek-V4,伯恩斯坦首次观察认为其“接近数月前的全球SOTA水平,但成本显著更低”,不过与国内同行(如Qwen、Z.ai、Kimi)的差距已缩小。V4-Pro按典型工作负载组合计算的混合Rev/Mtok约1美元,与GLM-5.1和Qwen3.6 Max相当,但发布不到24小时即推出75%的限时折扣,凸显用户获取策略的激进。

V4-Flash定价处于轻量模型的价格下限。腾讯hy3-preview被定位为过渡性产品,定价同样偏低,其价值在于验证腾讯能否通过重建AI数据与基础设施组织实现更快的模型迭代,以及何时能推出自己的“Muse Spark时刻”(更大规模模型)。

风险方面,研报隐含的行业主要不确定性包括模型能力差距收窄带来的价格竞争加剧、商业折扣对收入的实际影响、以及腾讯等巨头自研模型迭代速度的不确定性。估值层面,基于2026年预测,腾讯PE为14.6倍、阿里巴巴31.4倍、拼多多8.2倍、美团不适用(因盈利基数较低)、网易12.8倍、BOSS直聘11.0倍、京东10.3倍。伯恩斯坦认为,未来比较各实验室报告利润率与理论利润率将揭示硬件和软件优化水平的差异。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。