熱門資訊> 正文
2025-09-22 16:51
9月21日,明略科技宣佈旗下自主研發的 GUI 大模型 Mano 在業內公認的兩大挑戰性基準測試——OSWorld與 Mind2Web 中,雙雙取得了創紀錄的 SOTA 成績。這一成績不僅讓 Mano 成為通用 GUI 智能體的新範式,也意味着自動化邊界又被推遠了一大步。
刷新兩大榜單紀錄
在OSWorld-Verified 的 Foundation E2E GUI & Specialized Model 測試中,Mano 單次運行成功率達到 40.1%,整體表現均值為 41.6 ± 0.7%,超過 qwen、GUI-Owl、opencua 等全球同類模型。
另一項Mind2Web 基準覆蓋 137 個網站、2350 余項真實任務,涉及訂機票、填寫表格、在線購物等複雜操作,對模型的元素精度(Element Accuracy)、步驟成功率(Step SR)提出了極高要求。Mano 在這一測試中同樣表現突出,尤其在面對不斷變化的 DOM 結構和多樣化場景時,展現出卓越的適應能力。
三大核心技術
1. 在線強化學習Mano 在 GUI 交互領域首次提出了在線強化學習的訓練範式,並推出訓練數據自動採集的「探索器」,這兩大核心創新為其實現前所未有的圖形界面交互性能,奠定了堅實基礎。
2. 自動化訓練數據採集明略科技搭建虛擬環境集羣,利用插件和 DOM 提取器自動生成交互軌跡、元素信息和語義標註,大幅提高了訓練數據的多樣性和真實性。
3. 三階段訓練流程Mano 採用監督微調(SFT)、離線強化學習(Offline RL)、在線強化學習(Online RL)的三階段體系,將推理能力和任務適應性有機結合,解決了傳統模型難以應對動態場景的問題。
引領 GUI 智能體新範式
隨着生成式 AI 向「能動性」邁進,GUI 智能體正在成為人機交互的新方向。Mano 在「雙榜第一」的成績背后,是明略科技對智能體長期深耕的結果:從數據採集到訓練範式,從實驗室場景到真實複雜環境,Mano 都展現出可擴展性和穩定性。
明略科技表示,將繼續在數據採集、訓練推理整合、驗證碼處理等領域探索,推動 Mano 在真實應用和端側部署中的進一步優化,為企業的智能化轉型提供強有力的支持。
正如本次成果所示,中國企業完全有能力在全球前沿 AI 領域開闢出屬於自己的技術高地。