【愛建電子】人工智能月度跟蹤：WAIC 2025聚焦多種大模型、AI算力芯片和服務器

2025-08-19 10:21

（來源：愛建證券研究所）

WAIC 2025聚焦多種大模型、AI算力芯片和服務器

-人工智能月度跟蹤-

本報告發佈於2025年08月18日

WAIC 2025聚焦多種大模型、AI算力芯片和服務器

投資要點：

2025年7月26日至29日，WAIC 2025（世界人工智能大會）在上海舉行。本次大會以「智能時代，同球共濟」為主題，匯聚全球頂尖科技企業與創新公司，集中展示前沿產品、技術及行業發展趨勢，聚焦「學術突破、軟硬結合、全球治理」等亮點。會議涵蓋大模型、AI算力芯片、服務器等人工智能核心領域，重點展示了多種大模型及智能體、AI算力芯片和服務器。

在WAIC 2025大會上，階躍星辰、商湯科技、騰訊、阿里雲等企業展示了國產AI大模型與智能體的最新進展，各產品在技術特性與表現上各有側重。階躍星辰的Step-3採用MoE架構，在MMMU、MathVision等榜單獲開源最佳成績，同時Step-3在國產芯片上的推理效率、兼容性及成本控制表現突出，計劃全球開源並聯合廠商構建生態聯盟；商湯科技日日新V6.5強調圖文交錯思維，多模態交互得分超過Gemini 2.5 Flash和GPT-4o，性價比較前代提升3倍，依託升級的「商湯小浣熊」智能體綜合測試得分與Claude-4-Opus相當；騰訊混元3D世界模型1.0開源后下載量超230萬次，支持通過文本或圖像快速生成可編輯虛擬世界，同步開源的四款端側小模型具備Agent能力和長上下文處理能力，其中7B模型在特定測試中優於同類產品，體現輕量化趨勢；阿里雲Qwen3-Coder在編程測試中成績接近ClaudeSonnet4，輸入輸出成本均有優勢，同步發佈的千問3系列開源模型位居全球開源榜前列。這些進展反映出國產AI在多模態、特定領域能力及開源生態建設上的推進。

沐曦股份在本次WAIC2025發佈基於國產供應鏈的旗艦GPU——曦雲C600，這一成果標誌着國產高性能GPU實現了歷史性突破。曦雲C600基於沐曦自主知識產權核心GPU IP架構，構建了從設計、製造到封裝測試全流程的國產供應鏈閉環，實現核心技術自主可控。該芯片集成大容量存儲與多精度混合算力，支持MetaXLink超節點擴展技術，並內置ECC/RAS多重安全防護模塊。此外，沐曦還推出錨定雲端智算推理的曦思N系列、覆蓋智算與數據分析的曦雲C系列通用GPU以及專攻圖形渲染加速、服務雲遊戲與元宇宙的曦彩G系列，均依託自主技術與完整軟件棧，適配不同場景需求。

華為於本次WAIC 2025展出2025年4月發佈的AI算力集羣解決方案Cloud Matrix 384（即Atlas 900 A3 SuperPoD）。Cloud Matrix 384基於超節點架構，採用全對等（Peer-to-Peer）UB總線，將384顆NPU與192顆鯤鵬CPU緊密互聯；Atlas 900 A3 SuperPoD還搭載昇騰910C芯片，算力達300 PFLOPs，點到點訪問時延不足1微秒，適用於大模型推理、MOE訓練等場景。與英偉達GB 200 NVL72相比，其芯片封裝層性能稍遜（如BF16算力為對方0.3倍），但系統層級優勢明顯（BF16算力、HBM容量分別為對方1.7倍、3.6倍）。

投資建議：從本次WAIC的主要新技術產品展示情況來看，國產AI產業正在大模型，算力芯片和服務器設備多方面齊頭並進發展。2022年美國《芯片和科學法案》對先進算力芯片與半導體設備設出口限制，但是國內企業依然在持續升級大模型能力與硬件設備指標。我們認為國內AI產業鏈的相關投資機會值得長期關注。

風險提示：1）先進算力芯片限制加強2）下游應用需求不及預期3）國產模型迭代升級迟緩

1. WAIC 2025聚焦多種大模型、AI算力芯片和服務器

在WAIC 2025大會上，階躍星辰、商湯科技、騰訊、阿里雲等企業展示了國產AI大模型與智能體的最新進展，各產品在技術特性與表現上各有側重。階躍星辰的Step-3大模型採用MoE架構，在MMMU、MathVision等榜單獲開源最佳成績，同時Step-3大模型在國產芯片上的推理效率、兼容性及成本控制表現突出，計劃全球開源並聯合廠商構建生態聯盟；商湯科技日日新V6.5強調圖文交錯思維，多模態交互得分超過Gemini 2.5 Flash和GPT-4o，性價比較前代提升3倍，依託升級的「商湯小浣熊」智能體綜合測試得分與Claude-4-Opus相當；騰訊混元3D世界模型1.0開源后下載量超230萬次，支持通過文本或圖像快速生成可編輯虛擬世界，同步開源的四款端側小模型具備Agent能力和長上下文處理能力，其中7B模型在特定測試中優於同類產品，體現輕量化趨勢；阿里雲Qwen3-Coder在編程測試中成績接近ClaudeSonnet4，輸入輸出成本均有優勢，同步發佈的千問3系列開源模型位居全球開源榜前列。這些進展反映出國產AI在多模態、特定領域能力及開源生態建設上的推進。

華為於本次WAIC 2025展出2025年4月發佈的AI算力集羣解決方案Cloud Matrix384 （即Atlas 900 A3 SuperPoD）。Cloud Matrix 384基於超節點架構，採用全對等（Peer-to-Peer）UB總線，將384顆NPU與192顆鯤鵬CPU緊密互聯；Atlas 900 A3 SuperPoD還搭載昇騰910C芯片，算力達300 PFLOPs，點到點訪問時延不足1微秒，適用於大模型推理、MOE訓練等場景。與英偉達GB 200 NVL72相比，其芯片封裝層性能稍遜（如BF16算力為對方0.3倍），但系統層級優勢明顯（BF16算力、HBM容量分別為對方1.7倍、3.6倍）。

2. 多種國產大模型及智能體齊聚展會

國產大模型與智能體持續加速迭代。階躍星辰、商湯科技、阿里雲、騰訊等企業紛紛推出相關大模型與智能體，助力國產AI加速發展。在本次大會上，亮相的大模型包括階躍星辰的多模態推理大模型Step-3、商湯科技的日日新V6.5、騰訊的混元3D世界模型1.0，以及阿里雲的通義千問Qwen3-Coder。這些產品不僅涵蓋其他大模型的核心功能，並且在技術與應用層面展現出各自獨特的創新。

階躍星辰發佈多模態推理大模型Step-3

在WAIC 2025大會上，階躍星辰推出首個全尺寸、原生多模態推理模型Step-3。該公司在確保模型效果的同時，兼顧了推理成本。目前，目前Step-3已授權多家芯片公司並完成適配，於7月31日面向全球開源。

Step-3模型採用MoE架構，總參數量、激活參數量分別是321B、38B。與ERNIE 4.5和GLM-4.1V-Thinking相比，該模型在MMMU、MathVision、SimpleVQA、AIME2025、LiveCodeBench等榜單上均取得了開源多模態推理模型的SOTA（當前最佳）成績；不過在GPQA-Diamond榜單上，Step-3（72.9）則略低於ERNIE 4.5（76.8）。

Step-3在國產芯片上的推理效率最高可達DeepSeek-R1的300%，同時對所有芯片均具有良好的兼容性。基於英偉達Hopper架構芯片的分佈式推理測試，Step-3相比DeepSeek-R1吞吐量提升超過70%。

在同等激活參數條件下，Step-3的推理成本相對同類模型更低。Step-3在激活參數的成本對比中表現突出——不僅激活參數量領先於Kimi K2、Qwen3 MoE等模型，還保持着較低的推理成本（每32K上下文約1.2元）。

大會上，階躍星辰聯合近10家芯片及基礎設施廠商共同發起「模芯生態創新聯盟」。其中，華為昇騰芯片已率先完成對Step-3的適配與運行，其它聯盟廠商的適配工作也正在有序推進。

商湯科技發佈日日新V6.5大模型

商湯科技在WAIC 2025大會上發佈了日日新V6.5（SenseNova V6.5）大模型。該模型是國內首個實現圖文交錯思維的商業級大模型，其全面升級標誌着AI逐漸從」工具」向」人類」演進。

日日新V6.5具備推理能力強、效率高及支持智能體等優勢。該模型採用圖文交錯的多模態思維鏈機制，整體性能可媲美Gemini 2.5 Pro、Claude 4-Sonnet；在多項測試中，其多模態推理能力已超越這兩款模型，多模態交互平均得分77.97，領先於Gemini 2.5 Flash（76.04）和GPT-4o（75.40）。

日日新V6.5通過優化多模態架構，整體性價比較前代V6.0提升3倍。依託多模態模型融合架構的改進，日日新V6.5實現了跨模態早期融合，有效提升模型預訓練吞吐量（+20%）、強化學習效率（+40%），推理吞吐量提升更超35%，較前代日日新V6.0實現了顯著的性價比提升。

智能體「商湯小浣熊」依託日日新V6.5的多模態數據分析能力實現全面升級。在客户場景綜合測試中，其得分達79分，與世界標杆Claude-4-Opus水平相當，整體性能領先於OpenAI o3等模型；同時，「商湯小浣熊」在多項任務中的準確率接近100%，交互範式更顯高效智能。

騰訊混元3D世界模型1.0發佈並開源

騰訊元寶在WAIC 2025大會上正式發佈並開源混元3D世界模型1.0。該模型支持用户通過輸入一句話（文生）或一張圖（圖生），僅需幾分鍾即可生成可360°漫遊、可編輯的虛擬世界，同時輸出標準化3D資產，且兼容主流引擎，能顯著縮短內容生產周期。

混元大模型持續迭代發展。2023年9月，騰訊推出混元大模型，其發展方向從文本、圖像、視頻延伸至3D領域，並向輕量化演進。2024年5月，開源文生圖模型（混元DiT）以強化開源生態；2024年9月，推出新一代模型「混元Turbo」，聚焦性能升級；2025年7月，騰訊推出混元3D世界模型1.0，該模型作為全球最受歡迎的3D生成開源模型，下載量超230萬次；2025年8月，開源四款端側小模型（0.5B/1.8B/4B/7B），支持手機、車載等低功耗設備，推動模型輕量化發展。

騰訊混元8月開源的四款模型（0.5B/1.8B/4B/7B），亮點在於具備Agent能力與長文處理能力，其上下文窗口達256k；同時支持單卡部署，部分手機、平板等設備可直接接入，實現輕量化發展。其中，混元7B模型在AIME 2024和AIME 2025測試中的得分明顯優於同類模型，在語言理解、數學、推理等領域表現出色。

阿里雲主要展出通義千問Qwen3-Coder

在WAIC2025大會上，阿里通義千問重點展出最新開源的AI編程大模型Qwen3-Coder。該模型具備480B參數（激活35B參數），原生支持256K上下文，還可通過YaRN擴展至1M長度。在OpenAI發佈的Agent測試基準SWE-bench Verified中，Qwen3-Coder 500輪交互測試得分達69.6%，常規測試分數為67%，可與最強閉源代碼模型之一Claude Sonnet4的70.4%、68%分數表現相媲美。

在能力評測中，Qwen3-Coder在瀏覽器調用（WebArena）、工具調用（BFCL）等智能體能力相關評測里，刷新了開源模型的紀錄，成績成功超越DeepSeek-V3、GPT4.1。而在用於考察模型自主規劃解決編程任務的SWE-Bench評測中，Qwen3-Coder同樣取得了開源模型中的最佳成績，達到了可與Claude4媲美的水平。

使用成本上，Qwen3-Coder相較於Grok 4、Claude Sonnet 4、Kimi K2等模型具有價格低的優勢。目前Qwen3-Coder輸入、輸出價格分別為$0.2/Million Tokens、$0.8/Million Tokens。

此外，阿里雲還發布並開源了千問3最新版基礎模型（非思考版）與千問3推理模型，兩者均在全球開源榜中位居冠軍。同時，阿里雲還推出了首款專為AI Agents打造的「超級大腦」——無影AgentBay。該產品能夠實現跨系統無縫切換，並且可以隨時調用算力、存儲與工具鏈，為用户提供即開即用的智能開發環境，極大地提升了AI Agents開發的便捷性與效率。

3. 沐曦發佈旗艦GPU曦雲C600

沐曦於WAIC 2025正式發佈了基於國產供應鏈的旗艦GPU曦雲C600，標誌着國產高性能GPU實現突破。

沐曦正式發佈了基於國產供應鏈的旗艦GPU曦雲C600。該芯片基於沐曦自主知識產權核心GPU IP架構，構建從設計、製造到封裝測試的全流程的國產供應鏈閉環，核心技術自主可控。曦雲C600同時集成大容量存儲與多精度混合算力，支持MetaXLink超節點擴展技術，並內置ECC/RAS多重安全防護模塊，為金融、政務等關鍵領域提供高可靠算力基座。

從公司產品性能來看：

曦思N系列深度錨定雲端智算推理場景，依託高帶寬內存與領先視頻編解碼能力，以高速顯存配置、澎湃算力輸出，支撐大規模數據推理與超高清視頻流處理，搭配完整軟件棧，實現智算任務高效部署。

曦雲C系列作為通用GPU芯片，基於自主知識產權架構，具備超高精度算力與片間互聯MetaXLink技術，支持多GPU系統無縫協同，借自主軟件棧MXMACA構建全生態方案，覆蓋智算研發、數據分析等複雜場景。

曦彩G系列專攻圖形渲染並加速，憑自主架構輸出卓越圖形圖像渲染與視頻處理性能，以國產全功能顯卡身份，兼容主流GPU生態，為雲遊戲、元宇宙等場景提供高畫質、低延迟的算力支撐。

4. 華為展示昇騰384超節點

2025年4月華為發佈的AI算力集羣解決方案Cloud Matrix 384，通過全互連拓撲架構實現芯片間的高效協同，並在本次WAIC 2025大會上展出。本次WAIC 2025上，華為線下展出的昇騰384超節點基於超節點架構，採用全對等（Peer-to-Peer）UB總線，將384顆NPU與192顆鯤鵬CPU進行互聯。

Atlas 900基於昇騰910芯片構建，總算力規模達98PFLOPs，主要應用於大模型訓練、科學研究及商業創新等場景，系統功耗為736KW。

Atlas 900 A3 SuperPoD搭載昇騰910C芯片，具備超大帶寬、超低延迟、超強性能優勢。Atlas 900-A3-SuperPoD算力達300PFLOPs；在昇騰超節點集羣上，LLaMA3等千億稠密模型訓練性能為傳統集羣的2.5倍以上，Qwen、DS及MOE模型性能提升達3倍；點到點訪問時延不足1微秒，是業界唯一突破15ms Decode時延的方案；超節點內任意兩服務器單向帶寬達392GB/s。該產品功耗559KW，適用於大模型推理、MOE模型訓練、軌道交通、智能製造等場景。

華為昇騰910C Cloud Matrix384（改名為Atlas 900 A3 SuperPoD）與英偉達GB200 NVL72性能差異顯著。芯片封裝層，GB200 BF16 dense TFLOPS達2500 TFLOPS，是昇騰910C（780 TFLOPS）的3.2倍；HBM容量192GB，為昇騰910C（128GB）的1.5倍，帶寬8.0TB/s，是其2.5倍。

在系統層級，華為CM384 BF16 dense PFLOPS達300 PFLOPS，是英偉達GB200 NVL72的1.7倍；HBM容量為49.2TB，是GB200 NVL72（13.8TB）的3.6倍。但在全系統功耗方面，昇騰CM384達599.82KW，約為GB200NVL72的4.1倍。

5.風險提示

1）先進算力芯片限制加強

2）下游應用需求不及預期

3）國產模型迭代升級迟緩

免責聲明

愛建證券有限責任公司（下稱「愛建證券」）已獲中國證監會許可的證券投資諮詢業務資格，本訂閲號不是愛建證券研究報告發布平臺，所載內容均節選自於愛建證券已正式發佈的研究報告，所推送觀點和信息僅供愛建證券研究服務客户參考，完整的投資觀點應以愛建證券研究所發佈的完整報告爲準。若您非愛建證券研究服務客户，請勿訂閲、接受、轉載或使用本平臺中的任何信息。愛建證券不會因訂閲本平臺的行為或者收到、閲讀本公眾號推送內容而視為客户。任何未經愛建證券同意或授權而對本平臺內容進行復制、轉發或其他類似不當行為均被嚴格禁止。對於使用本平臺包含信息所引起的后果，愛建證券概不承擔任何責任。

本平臺報告是基於已公開信息撰寫，但本公司不保證該等信息的準確性或完整性。報告所載的資料、意見及預測僅反映本公司於發佈本報告當日的判斷，且預測方法及結果存在一定程度侷限性。在不同時期，本公司可發出與本報告所刊載的意見、預測不一致的報告，但本公司沒有義務和責任及時更新本報告所涉及的內容並通知客户。

在任何情況下，本公眾號所載信息、意見不構成任何投資建議，所述證券或金融工具買賣的評級、目標價、估值、盈利預測等分析判斷亦不構成對證券或金融工具在具體價位、時點、市場表現的投資建議。對任何直接或間接使用本公眾號所載信息和內容或者據此進行投資所造成的任何一切后果或損失，愛建證券及其關聯人員均不承擔任何形式的法律責任。

法律聲明

本平臺為愛建證券有限責任公司研究所（下稱「愛建研究」）依法設立、運營的唯一官方訂閲號。根據《證券期貨投資者適當性管理辦法》，本微信平臺所載內容僅供愛建證券客户中專業投資者參考使用。若您非愛建證券客户中的專業投資者，為控制投資風險，請勿訂閲、接受、轉載或使用本平臺中的任何信息。愛建證券不會因接收人收到本內容而視其為客户，且由於僅為研究觀點的簡要表述，客户需以愛建證券研究所發佈的完整報告爲準。

市場有風險，投資需謹慎。在任何情況下，本微信平臺所載信息或所表述的意見並不構成對任何人的投資建議。在任何情況下，本公司不對任何人因使用本微信平臺中的任何內容所引致的任何損失負任何責任。

【愛建電子】人工智能月度跟蹤：WAIC 2025聚焦多種大模型、AI算力芯片和服務器

推薦文章

美股機會日報 | 凌晨3點！美聯儲將公佈1月貨幣政策會議紀要，納指期貨漲近0.5%；13F大曝光！巴菲特連續三季減持蘋果

美股機會日報 | 阿里發佈千問3.5！性能媲美Gemini 3；馬斯克稱Cybercab將於4月開始生產

港股周報 | 中國大模型「春節檔」打響！智譜周漲超138%；鉅虧超230億！美團周內重挫超10%

一周財經日曆 | 港美股迎「春節+總統日」雙假期！萬億零售巨頭沃爾瑪將發財報

從軟件到房地產，美國多板塊陷入AI恐慌拋售潮

Meta計劃為智能眼鏡添加人臉識別技術

危機四伏，市場卻似乎毫不在意

財報前瞻 | 英偉達Q4財報放榜在即！高盛、瑞銀預計將大超預期，兩大關鍵催化將帶來意外驚喜？