【爱建电子】人工智能月度跟踪：WAIC 2025聚焦多种大模型、AI算力芯片和服务器

2025-08-19 10:21

（来源：爱建证券研究所）

WAIC 2025聚焦多种大模型、AI算力芯片和服务器

-人工智能月度跟踪-

本报告发布于2025年08月18日

WAIC 2025聚焦多种大模型、AI算力芯片和服务器

投资要点：

2025年7月26日至29日，WAIC 2025（世界人工智能大会）在上海举行。本次大会以“智能时代，同球共济”为主题，汇聚全球顶尖科技企业与创新公司，集中展示前沿产品、技术及行业发展趋势，聚焦“学术突破、软硬结合、全球治理”等亮点。会议涵盖大模型、AI算力芯片、服务器等人工智能核心领域，重点展示了多种大模型及智能体、AI算力芯片和服务器。

在WAIC 2025大会上，阶跃星辰、商汤科技、腾讯、阿里云等企业展示了国产AI大模型与智能体的最新进展，各产品在技术特性与表现上各有侧重。阶跃星辰的Step-3采用MoE架构，在MMMU、MathVision等榜单获开源最佳成绩，同时Step-3在国产芯片上的推理效率、兼容性及成本控制表现突出，计划全球开源并联合厂商构建生态联盟；商汤科技日日新V6.5强调图文交错思维，多模态交互得分超过Gemini 2.5 Flash和GPT-4o，性价比较前代提升3倍，依托升级的“商汤小浣熊”智能体综合测试得分与Claude-4-Opus相当；腾讯混元3D世界模型1.0开源后下载量超230万次，支持通过文本或图像快速生成可编辑虚拟世界，同步开源的四款端侧小模型具备Agent能力和长上下文处理能力，其中7B模型在特定测试中优于同类产品，体现轻量化趋势；阿里云Qwen3-Coder在编程测试中成绩接近ClaudeSonnet4，输入输出成本均有优势，同步发布的千问3系列开源模型位居全球开源榜前列。这些进展反映出国产AI在多模态、特定领域能力及开源生态建设上的推进。

沐曦股份在本次WAIC2025发布基于国产供应链的旗舰GPU——曦云C600，这一成果标志着国产高性能GPU实现了历史性突破。曦云C600基于沐曦自主知识产权核心GPU IP架构，构建了从设计、制造到封装测试全流程的国产供应链闭环，实现核心技术自主可控。该芯片集成大容量存储与多精度混合算力，支持MetaXLink超节点扩展技术，并内置ECC/RAS多重安全防护模块。此外，沐曦还推出锚定云端智算推理的曦思N系列、覆盖智算与数据分析的曦云C系列通用GPU以及专攻图形渲染加速、服务云游戏与元宇宙的曦彩G系列，均依托自主技术与完整软件栈，适配不同场景需求。

华为于本次WAIC 2025展出2025年4月发布的AI算力集群解决方案Cloud Matrix 384（即Atlas 900 A3 SuperPoD）。Cloud Matrix 384基于超节点架构，采用全对等（Peer-to-Peer）UB总线，将384颗NPU与192颗鲲鹏CPU紧密互联；Atlas 900 A3 SuperPoD还搭载昇腾910C芯片，算力达300 PFLOPs，点到点访问时延不足1微秒，适用于大模型推理、MOE训练等场景。与英伟达GB 200 NVL72相比，其芯片封装层性能稍逊（如BF16算力为对方0.3倍），但系统层级优势明显（BF16算力、HBM容量分别为对方1.7倍、3.6倍）。

投资建议：从本次WAIC的主要新技术产品展示情况来看，国产AI产业正在大模型，算力芯片和服务器设备多方面齐头并进发展。2022年美国《芯片和科学法案》对先进算力芯片与半导体设备设出口限制，但是国内企业依然在持续升级大模型能力与硬件设备指标。我们认为国内AI产业链的相关投资机会值得长期关注。

风险提示：1）先进算力芯片限制加强2）下游应用需求不及预期3）国产模型迭代升级迟缓

1. WAIC 2025聚焦多种大模型、AI算力芯片和服务器

在WAIC 2025大会上，阶跃星辰、商汤科技、腾讯、阿里云等企业展示了国产AI大模型与智能体的最新进展，各产品在技术特性与表现上各有侧重。阶跃星辰的Step-3大模型采用MoE架构，在MMMU、MathVision等榜单获开源最佳成绩，同时Step-3大模型在国产芯片上的推理效率、兼容性及成本控制表现突出，计划全球开源并联合厂商构建生态联盟；商汤科技日日新V6.5强调图文交错思维，多模态交互得分超过Gemini 2.5 Flash和GPT-4o，性价比较前代提升3倍，依托升级的“商汤小浣熊”智能体综合测试得分与Claude-4-Opus相当；腾讯混元3D世界模型1.0开源后下载量超230万次，支持通过文本或图像快速生成可编辑虚拟世界，同步开源的四款端侧小模型具备Agent能力和长上下文处理能力，其中7B模型在特定测试中优于同类产品，体现轻量化趋势；阿里云Qwen3-Coder在编程测试中成绩接近ClaudeSonnet4，输入输出成本均有优势，同步发布的千问3系列开源模型位居全球开源榜前列。这些进展反映出国产AI在多模态、特定领域能力及开源生态建设上的推进。

华为于本次WAIC 2025展出2025年4月发布的AI算力集群解决方案Cloud Matrix384 （即Atlas 900 A3 SuperPoD）。Cloud Matrix 384基于超节点架构，采用全对等（Peer-to-Peer）UB总线，将384颗NPU与192颗鲲鹏CPU紧密互联；Atlas 900 A3 SuperPoD还搭载昇腾910C芯片，算力达300 PFLOPs，点到点访问时延不足1微秒，适用于大模型推理、MOE训练等场景。与英伟达GB 200 NVL72相比，其芯片封装层性能稍逊（如BF16算力为对方0.3倍），但系统层级优势明显（BF16算力、HBM容量分别为对方1.7倍、3.6倍）。

2. 多种国产大模型及智能体齐聚展会

国产大模型与智能体持续加速迭代。阶跃星辰、商汤科技、阿里云、腾讯等企业纷纷推出相关大模型与智能体，助力国产AI加速发展。在本次大会上，亮相的大模型包括阶跃星辰的多模态推理大模型Step-3、商汤科技的日日新V6.5、腾讯的混元3D世界模型1.0，以及阿里云的通义千问Qwen3-Coder。这些产品不仅涵盖其他大模型的核心功能，并且在技术与应用层面展现出各自独特的创新。

阶跃星辰发布多模态推理大模型Step-3

在WAIC 2025大会上，阶跃星辰推出首个全尺寸、原生多模态推理模型Step-3。该公司在确保模型效果的同时，兼顾了推理成本。目前，目前Step-3已授权多家芯片公司并完成适配，于7月31日面向全球开源。

Step-3模型采用MoE架构，总参数量、激活参数量分别是321B、38B。与ERNIE 4.5和GLM-4.1V-Thinking相比，该模型在MMMU、MathVision、SimpleVQA、AIME2025、LiveCodeBench等榜单上均取得了开源多模态推理模型的SOTA（当前最佳）成绩；不过在GPQA-Diamond榜单上，Step-3（72.9）则略低于ERNIE 4.5（76.8）。

Step-3在国产芯片上的推理效率最高可达DeepSeek-R1的300%，同时对所有芯片均具有良好的兼容性。基于英伟达Hopper架构芯片的分布式推理测试，Step-3相比DeepSeek-R1吞吐量提升超过70%。

在同等激活参数条件下，Step-3的推理成本相对同类模型更低。Step-3在激活参数的成本对比中表现突出——不仅激活参数量领先于Kimi K2、Qwen3 MoE等模型，还保持着较低的推理成本（每32K上下文约1.2元）。

大会上，阶跃星辰联合近10家芯片及基础设施厂商共同发起“模芯生态创新联盟”。其中，华为昇腾芯片已率先完成对Step-3的适配与运行，其它联盟厂商的适配工作也正在有序推进。

商汤科技发布日日新V6.5大模型

商汤科技在WAIC 2025大会上发布了日日新V6.5（SenseNova V6.5）大模型。该模型是国内首个实现图文交错思维的商业级大模型，其全面升级标志着AI逐渐从”工具”向”人类”演进。

日日新V6.5具备推理能力强、效率高及支持智能体等优势。该模型采用图文交错的多模态思维链机制，整体性能可媲美Gemini 2.5 Pro、Claude 4-Sonnet；在多项测试中，其多模态推理能力已超越这两款模型，多模态交互平均得分77.97，领先于Gemini 2.5 Flash（76.04）和GPT-4o（75.40）。

日日新V6.5通过优化多模态架构，整体性价比较前代V6.0提升3倍。依托多模态模型融合架构的改进，日日新V6.5实现了跨模态早期融合，有效提升模型预训练吞吐量（+20%）、强化学习效率（+40%），推理吞吐量提升更超35%，较前代日日新V6.0实现了显著的性价比提升。

智能体“商汤小浣熊”依托日日新V6.5的多模态数据分析能力实现全面升级。在客户场景综合测试中，其得分达79分，与世界标杆Claude-4-Opus水平相当，整体性能领先于OpenAI o3等模型；同时，“商汤小浣熊”在多项任务中的准确率接近100%，交互范式更显高效智能。

腾讯混元3D世界模型1.0发布并开源

腾讯元宝在WAIC 2025大会上正式发布并开源混元3D世界模型1.0。该模型支持用户通过输入一句话（文生）或一张图（图生），仅需几分钟即可生成可360°漫游、可编辑的虚拟世界，同时输出标准化3D资产，且兼容主流引擎，能显著缩短内容生产周期。

混元大模型持续迭代发展。2023年9月，腾讯推出混元大模型，其发展方向从文本、图像、视频延伸至3D领域，并向轻量化演进。2024年5月，开源文生图模型（混元DiT）以强化开源生态；2024年9月，推出新一代模型“混元Turbo”，聚焦性能升级；2025年7月，腾讯推出混元3D世界模型1.0，该模型作为全球最受欢迎的3D生成开源模型，下载量超230万次；2025年8月，开源四款端侧小模型（0.5B/1.8B/4B/7B），支持手机、车载等低功耗设备，推动模型轻量化发展。

腾讯混元8月开源的四款模型（0.5B/1.8B/4B/7B），亮点在于具备Agent能力与长文处理能力，其上下文窗口达256k；同时支持单卡部署，部分手机、平板等设备可直接接入，实现轻量化发展。其中，混元7B模型在AIME 2024和AIME 2025测试中的得分明显优于同类模型，在语言理解、数学、推理等领域表现出色。

阿里云主要展出通义千问Qwen3-Coder

在WAIC2025大会上，阿里通义千问重点展出最新开源的AI编程大模型Qwen3-Coder。该模型具备480B参数（激活35B参数），原生支持256K上下文，还可通过YaRN扩展至1M长度。在OpenAI发布的Agent测试基准SWE-bench Verified中，Qwen3-Coder 500轮交互测试得分达69.6%，常规测试分数为67%，可与最强闭源代码模型之一Claude Sonnet4的70.4%、68%分数表现相媲美。

在能力评测中，Qwen3-Coder在浏览器调用（WebArena）、工具调用（BFCL）等智能体能力相关评测里，刷新了开源模型的纪录，成绩成功超越DeepSeek-V3、GPT4.1。而在用于考察模型自主规划解决编程任务的SWE-Bench评测中，Qwen3-Coder同样取得了开源模型中的最佳成绩，达到了可与Claude4媲美的水平。

使用成本上，Qwen3-Coder相较于Grok 4、Claude Sonnet 4、Kimi K2等模型具有价格低的优势。目前Qwen3-Coder输入、输出价格分别为$0.2/Million Tokens、$0.8/Million Tokens。

此外，阿里云还发布并开源了千问3最新版基础模型（非思考版）与千问3推理模型，两者均在全球开源榜中位居冠军。同时，阿里云还推出了首款专为AI Agents打造的“超级大脑”——无影AgentBay。该产品能够实现跨系统无缝切换，并且可以随时调用算力、存储与工具链，为用户提供即开即用的智能开发环境，极大地提升了AI Agents开发的便捷性与效率。

3. 沐曦发布旗舰GPU曦云C600

沐曦于WAIC 2025正式发布了基于国产供应链的旗舰GPU曦云C600，标志着国产高性能GPU实现突破。

沐曦正式发布了基于国产供应链的旗舰GPU曦云C600。该芯片基于沐曦自主知识产权核心GPU IP架构，构建从设计、制造到封装测试的全流程的国产供应链闭环，核心技术自主可控。曦云C600同时集成大容量存储与多精度混合算力，支持MetaXLink超节点扩展技术，并内置ECC/RAS多重安全防护模块，为金融、政务等关键领域提供高可靠算力基座。

从公司产品性能来看：

曦思N系列深度锚定云端智算推理场景，依托高带宽内存与领先视频编解码能力，以高速显存配置、澎湃算力输出，支撑大规模数据推理与超高清视频流处理，搭配完整软件栈，实现智算任务高效部署。

曦云C系列作为通用GPU芯片，基于自主知识产权架构，具备超高精度算力与片间互联MetaXLink技术，支持多GPU系统无缝协同，借自主软件栈MXMACA构建全生态方案，覆盖智算研发、数据分析等复杂场景。

曦彩G系列专攻图形渲染并加速，凭自主架构输出卓越图形图像渲染与视频处理性能，以国产全功能显卡身份，兼容主流GPU生态，为云游戏、元宇宙等场景提供高画质、低延迟的算力支撑。

4. 华为展示昇腾384超节点

2025年4月华为发布的AI算力集群解决方案Cloud Matrix 384，通过全互连拓扑架构实现芯片间的高效协同，并在本次WAIC 2025大会上展出。本次WAIC 2025上，华为线下展出的昇腾384超节点基于超节点架构，采用全对等（Peer-to-Peer）UB总线，将384颗NPU与192颗鲲鹏CPU进行互联。

Atlas 900基于昇腾910芯片构建，总算力规模达98PFLOPs，主要应用于大模型训练、科学研究及商业创新等场景，系统功耗为736KW。

Atlas 900 A3 SuperPoD搭载昇腾910C芯片，具备超大带宽、超低延迟、超强性能优势。Atlas 900-A3-SuperPoD算力达300PFLOPs；在昇腾超节点集群上，LLaMA3等千亿稠密模型训练性能为传统集群的2.5倍以上，Qwen、DS及MOE模型性能提升达3倍；点到点访问时延不足1微秒，是业界唯一突破15ms Decode时延的方案；超节点内任意两服务器单向带宽达392GB/s。该产品功耗559KW，适用于大模型推理、MOE模型训练、轨道交通、智能制造等场景。

华为昇腾910C Cloud Matrix384（改名为Atlas 900 A3 SuperPoD）与英伟达GB200 NVL72性能差异显著。芯片封装层，GB200 BF16 dense TFLOPS达2500 TFLOPS，是昇腾910C（780 TFLOPS）的3.2倍；HBM容量192GB，为昇腾910C（128GB）的1.5倍，带宽8.0TB/s，是其2.5倍。

在系统层级，华为CM384 BF16 dense PFLOPS达300 PFLOPS，是英伟达GB200 NVL72的1.7倍；HBM容量为49.2TB，是GB200 NVL72（13.8TB）的3.6倍。但在全系统功耗方面，昇腾CM384达599.82KW，约为GB200NVL72的4.1倍。

5.风险提示

1）先进算力芯片限制加强

2）下游应用需求不及预期

3）国产模型迭代升级迟缓

免责声明

爱建证券有限责任公司（下称“爱建证券”）已获中国证监会许可的证券投资咨询业务资格，本订阅号不是爱建证券研究报告发布平台，所载内容均节选自于爱建证券已正式发布的研究报告，所推送观点和信息仅供爱建证券研究服务客户参考，完整的投资观点应以爱建证券研究所发布的完整报告为准。若您非爱建证券研究服务客户，请勿订阅、接受、转载或使用本平台中的任何信息。爱建证券不会因订阅本平台的行为或者收到、阅读本公众号推送内容而视为客户。任何未经爱建证券同意或授权而对本平台内容进行复制、转发或其他类似不当行为均被严格禁止。对于使用本平台包含信息所引起的后果，爱建证券概不承担任何责任。

本平台报告是基于已公开信息撰写，但本公司不保证该等信息的准确性或完整性。报告所载的资料、意见及预测仅反映本公司于发布本报告当日的判断，且预测方法及结果存在一定程度局限性。在不同时期，本公司可发出与本报告所刊载的意见、预测不一致的报告，但本公司没有义务和责任及时更新本报告所涉及的内容并通知客户。

在任何情况下，本公众号所载信息、意见不构成任何投资建议，所述证券或金融工具买卖的评级、目标价、估值、盈利预测等分析判断亦不构成对证券或金融工具在具体价位、时点、市场表现的投资建议。对任何直接或间接使用本公众号所载信息和内容或者据此进行投资所造成的任何一切后果或损失，爱建证券及其关联人员均不承担任何形式的法律责任。

法律声明

本平台为爱建证券有限责任公司研究所（下称“爱建研究”）依法设立、运营的唯一官方订阅号。根据《证券期货投资者适当性管理办法》，本微信平台所载内容仅供爱建证券客户中专业投资者参考使用。若您非爱建证券客户中的专业投资者，为控制投资风险，请勿订阅、接受、转载或使用本平台中的任何信息。爱建证券不会因接收人收到本内容而视其为客户，且由于仅为研究观点的简要表述，客户需以爱建证券研究所发布的完整报告为准。

市场有风险，投资需谨慎。在任何情况下，本微信平台所载信息或所表述的意见并不构成对任何人的投资建议。在任何情况下，本公司不对任何人因使用本微信平台中的任何内容所引致的任何损失负任何责任。

【爱建电子】人工智能月度跟踪：WAIC 2025聚焦多种大模型、AI算力芯片和服务器

推荐文章

港股周报 | 中国大模型“春节档”打响！智谱周涨超138%；巨亏超230亿！美团周内重挫超10%

一周财经日历 | 港美股迎“春节+总统日”双假期！万亿零售巨头沃尔玛将发财报

一周IPO | 赚钱效应持续火热！年内24只上市新股“0”破发；“图模融合第一股”海致科技首日飙涨逾242%

从软件到房地产，美国多板块陷入AI恐慌抛售潮

Meta计划为智能眼镜添加人脸识别技术

危机四伏，市场却似乎毫不在意

美股机会日报 | 降息预期升温！美国1月CPI年率创去年5月来新低；净利、指引双超预期！应用材料盘前涨超10%

财报前瞻 | 英伟达Q4财报放榜在即！高盛、瑞银预计将大超预期，两大关键催化将带来意外惊喜？