繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

小米開源首個原生端到端語音大模型Xiaomi-MiMo-Audio

2025-09-19 10:03

9月19日,小米正式開源首個原生端到端語音模型——Xiaomi-MiMo-Audio,它基於創新預訓練架構和上億小時訓練數據,首次在語音領域實現基於ICL的少樣本泛化,並在預訓練觀察到明顯的「涌現」行為。

據介紹,在通用語音理解及對話等多項標準評測基準中,MiMo-Audio大幅超越了同參數量的開源模型,取得7B最佳性能;在音頻理解基準MMAU的標準測試集上,MiMo-Audio超過Google閉源語音模型Gemini-2.5-Flash;在面向音頻複雜推理的基準Big Bench Audio S2T任務中,MiMo-Audio同樣超越了OpenAI閉源的語音模型GPT-4o-Audio-Preview。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。