繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

明略科技 Mano 大模型斬獲「雙榜第一」,帶來 GUI 智能體新範式

2025-09-22 16:51

9月21日,明略科技宣佈旗下自主研發的 GUI 大模型 Mano 在業內公認的兩大挑戰性基準測試——OSWorld與 Mind2Web 中,雙雙取得了創紀錄的 SOTA 成績。這一成績不僅讓 Mano 成為通用 GUI 智能體的新範式,也意味着自動化邊界又被推遠了一大步。

刷新兩大榜單紀錄

OSWorld-Verified 的 Foundation E2E GUI & Specialized Model 測試中,Mano 單次運行成功率達到 40.1%,整體表現均值為 41.6 ± 0.7%,超過 qwen、GUI-Owl、opencua 等全球同類模型。

另一項Mind2Web 基準覆蓋 137 個網站、2350 余項真實任務,涉及訂機票、填寫表格、在線購物等複雜操作,對模型的元素精度(Element Accuracy)、步驟成功率(Step SR)提出了極高要求。Mano 在這一測試中同樣表現突出,尤其在面對不斷變化的 DOM 結構和多樣化場景時,展現出卓越的適應能力。

三大核心技術

1. 在線強化學習Mano 在 GUI 交互領域首次提出了在線強化學習的訓練範式,並推出訓練數據自動採集的「探索器」,這兩大核心創新為其實現前所未有的圖形界面交互性能,奠定了堅實基礎。

2. 自動化訓練數據採集明略科技搭建虛擬環境集羣,利用插件和 DOM 提取器自動生成交互軌跡、元素信息和語義標註,大幅提高了訓練數據的多樣性和真實性。

3. 三階段訓練流程Mano 採用監督微調(SFT)、離線強化學習(Offline RL)、在線強化學習(Online RL)的三階段體系,將推理能力和任務適應性有機結合,解決了傳統模型難以應對動態場景的問題。

引領 GUI 智能體新範式

隨着生成式 AI 向「能動性」邁進,GUI 智能體正在成為人機交互的新方向。Mano 在「雙榜第一」的成績背后,是明略科技對智能體長期深耕的結果:從數據採集到訓練範式,從實驗室場景到真實複雜環境,Mano 都展現出可擴展性和穩定性。

明略科技表示,將繼續在數據採集、訓練推理整合、驗證碼處理等領域探索,推動 Mano 在真實應用和端側部署中的進一步優化,為企業的智能化轉型提供強有力的支持。

正如本次成果所示,中國企業完全有能力在全球前沿 AI 領域開闢出屬於自己的技術高地。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。