熱門資訊> 正文
2025-09-05 21:17
9月5日,在2025重慶世界智能產業博覽會上,中科曙光(603019.SH)發佈了國內首個基於AI計算開放架構設計的產品——曙光AI超集羣系統。該系統以GPU為核心,實現了「算、存、網、電、冷、管、軟」一體化緊耦合設計,具備「超高性能、超高效率、超高可靠、全面開放」四大特點,可為萬億參數大模型訓練推理、行業大模型微調、多模態大模型開發、AI4S等場景提供高效算力底座。
曙光AI超集羣系統具有如下技術特點:
超高性能:單機櫃可搭載96張GPU卡、算力規模達百P級、訪存總帶寬超180TB/s;支持多精度、混合精度運算;支持百萬卡超大集羣擴展。
超高效率:千卡集羣大模型訓練推理性能達到業界主流水平2.3倍、開發效率提升4倍、人天投入減少70%;存算傳協同,提升GPU計算效率55%;先進冷板液冷,394項節能設計PUE低於1.12。
超高可靠:121項設備和鏈路RAS可靠性設計;平均無故障時間(MTBF)提高2.1倍;平均故障修復時間(MTTR)降低47%;超30天長穩運行集羣可靠性測試;實現百萬級部件故障自動分析與秒級隔離。
全面開放:基於AI計算開放架構設計;硬件適配多品牌AI加速卡;軟件兼容主流AI計算生態;多項技術能力開放與共享。