繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

重磅發佈!小米系全線大漲!「AI大模型大戰」再起

2025-04-30 14:43

  一則消息突然引爆。

  今日,小米系集體爆發,小米集團一度大漲超5%,金山雲一度大漲超18%。消息面上,小米大模型微信公眾號稱,小米開源首個為推理(Reasoning)而生的大模型「Xiaomi MiMo」,聯動預訓練到后訓練,全面提升推理能力。

當前,AI大模型競爭再度進入白熱化。4月29日,阿里巴巴通義千問發佈了新版Qwen 3系列模型。同一天,世界首富馬斯克也宣佈,下周Grok 3.5早期測試版將向SuperGrok訂閲者發佈。

  券商機構分析認為,國內外大模型能力差距縮小,國產算力芯片持續進化,國內頭部互聯網廠商加大Capex投入,為國內AI突圍之路奠定了基石。伴隨國內外巨頭大模型持續迭代,C端或有望迎來殺手級應用。

全線大漲

  4月30日,小米系全線拉昇,小米集團盤中一度大漲超5%,金山雲一度大漲超18%,金山軟件最高漲超6%。

  與此同時,港股雲計算板塊持續拉昇,截至午間收盤,金蝶國際漲4.7%,中國軟件國際漲2.72%,阿里巴巴-W漲1.48%

  據「小米大模型」公眾號消息,今日,小米開源首個為推理(Reasoning)而生的大模型「Xiaomi MiMo」,聯動預訓練到后訓練,全面提升推理能力。

  據介紹,在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo以7B的參數規模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規模的開源推理模型QwQ-32B-Preview。

官方稱,在相同RL訓練數據情況下,MiMo-7B的數學&代碼領域的強化學習潛力顯著領先。iMo-7B全系列模型均已開源。

  小米技術團隊表示,MiMo的核心突破在於預訓練與后訓練階段的協同優化。在預訓練階段,模型通過挖掘高質量推理語料併合成約2000億tokens專項數據,採用三階段漸進訓練策略,累計訓練量達25萬億tokens。

  后訓練階段則引入創新強化學習技術,包括自研的「Test Difficulty Driven Reward」算法和「Easy Data Re-Sampling」策略,有效提升模型在複雜任務中的穩定性。技術團隊還開發了「Seamless Rollout」系統,使訓練效率提升2.29倍,驗證速度加快1.96倍。

  值得注意的是,小米官方表示,MiMo-7B在相同強化學習訓練數據下,數學與代碼領域的表現顯著優於當前業界廣泛使用的DeepSeek-R1-Distill-7B和Qwen2.5-32B模型。

  目前,小米已在HuggingFace平臺開源MiMo-7B全系列4個模型,併發布詳細技術報告。

  值得一提的是,就在小米宣佈「Xiaomi Mimo」開源前,阿里巴巴通義千問於4月29日凌晨發佈了新版Qwen 3 系列模型,包括2個MoE模型和6個dense模型。

  通義千問表示,作為Qwen系列全新一代的混合推理模型,Qwen 3在GPQA、AIME24/25、LiveCodeBench等多個權威評測中表現出極具競爭力的結果。在相同計算資源下,Qwen 3模型以更小的規模實現了對更大體量上一代模型的超越,真正做到了「小而強大」。

  Qwen 3融合了推理與非推理能力,在邏輯分析和創意生成等任務中表現卓越。預訓練數據量達到約36萬億tokens,並通過多輪大規模強化學習與精細優化,在推理、工具調用、指令遵循及多語言能力等方面顯著提升。

「AI大模型大戰」再起

  值得注意的是,AI大模型競爭再度進入白熱化。

  4月29日,馬斯克在社交平臺上宣佈,下周,Grok 3.5早期測試版將向SuperGrok訂閲者發佈,它是第一個能夠準確回答有關火箭發動機或電化學技術問題的人工智能。馬斯克稱,Grok是從第一原理推理並得出互聯網上根本不存在的答案。

  2025年以來,全球AI大模型的競爭愈發激烈,據不完全統計,在過去119天內,中美十家主要大模型公司就發佈或更新了14款基礎大模型。

  國際市場調研機構Artificial Analysis發佈的報告顯示,美國大模型雖然目前還領先,但中國的差距在不斷縮小。

西部證券指出,AI大模型能力提升和使用成本下降是主旋律,多模態或逐步成為未來基礎模型的標配,進一步拉動算力需求。國內外大模型能力差距縮小,國產算力芯片持續進化,國內頭部互聯網廠商加大Capex投入,為國內AI突圍之路奠定了基石。

  開源證券認為,AI Agent為以大語言模型(LLM)為驅動,具有自主理解、感知、規劃、記憶和使用工具的能力,能自動執行復雜任務的系統。不同於傳統人工智能,AI Agent具備通過獨立思考、調用工具逐步完成給定目標的能力。看好AI Agent應用將在2025年多點開花,其中AI Agent有望在B端率先商業化,電商、營銷、CRM、金融、法律等場景加速落地。伴隨國內外巨頭大模型持續迭代,C端或有望迎來殺手級應用。

天風證券表示,通義千問體系在模型能力、硬件能力及生態建設上保持領先,已實現全模態覆蓋,成為全球最大模型開源生態。其自主算力體系較強,覆蓋通用計算與智算需求,在自主可控行業具有優勢。AI Agent市場規模有望超萬億,通義千問憑藉在B端資源稟賦及深厚技術積澱,已發佈多行業垂直生態體系,有望成為B端Agent鏈主,相關生態體系公司或將受益。

(文章來源:券商中國)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。