商湯絕影發佈端側多模態智能體基座大模型Sage，打通「艙駕一體」方案量產模型路徑

2026-04-22 15:51

公司情報專家《財經塗鴉》獲悉，4月22日，商湯絕影正式發佈端側多模態智能體基座大模型Sage，首次將雲端級智能體能力落地端側。

據悉，Sage採用MoE架構，總參數量為32B，激活參數僅3B，打破「只有大模型才能做好智能體任務」的慣性認知，超越眾多大參數量雲側旗艦，成為行業內首款在車端實現複雜智能體能力的基座大模型，並已在英偉達 Orin X 端側平臺實現部署。

作為端側智能體基座，Sage可接入OpenClaw、Hermes等主流Agent框架，為更多端側智能體落地提供核心支撐，可覆蓋出行、家庭等全場景。

在公開Agent評測基準PinchBench中，Sage端側大模型最佳任務完成率達到94%，超越Claude-Opus-4.6、GPT-5.4、Gemini-3、Gemma-4、Qwen3.5-27B、MiniMax-M2.7等國際主流雲側和端側大模型。

PinchBench是龍蝦之父Peter Steinberger推薦的公開Agent評測基準，面向真實Agent工作流評測，重點考察模型在工具調用、多步推理和任務閉環執行中的綜合能力。

與此同時，PinchBench評測要求模型完成真實任務執行，並綜合衡量成功率、速度與成本，因此測試周期更長、資源消耗更高，單任務token消耗就可達數十萬量級。正因如此，模型在PinchBench上取得的精度表現，更能體現其在複雜真實場景中的綜合能力與穩定性。

Sage跑贏背后，是商湯絕影圍繞Sage后訓練階段自研的兩項關鍵技術：SCOUT和ERL。前者讓模型「學得又快又省」，后者讓模型「做事不出錯」，重點突破智能體在學習效率、訓練成本和複雜任務穩定執行上的行業挑戰，解決了讓車載大模型從"能聽懂指令"進化到"能獨立辦成一件複雜的事"的行業公認難題。

另外，在不同能力維度的公開基準上，Sage亦全面領先本月最新發布的同量級端側旗艦模型 Google-Gemma4，把端側模型的能力天花板抬到了一個新的水位。

這些專業能力落到真實車艙，轉化為一組直接影響用户體驗的指標：Sage 場景推理精度超過 90%，長鏈路工具調用、邏輯規劃、環境感知任務成功率分別達 92%、89%、94%，複雜指令遵循率提升 40%。

業內認為，Sage端側多模態智能體基座大模型為艙駕一體方案打通了量產可行的模型路徑，打破了技術與落地之間的壁壘，推動智能座艙從基礎交互向高階艙駕融合智能體服務跨越。

據商湯絕影透露，不久后的北京車展期間，將正式推出搭載Sage端側多模態智能體基座大模型的Sage Box，為汽車邁入超級智能體時代築牢核心根基。