明略科技 Mano 大模型斬獲「雙榜第一」，帶來 GUI 智能體新範式

2025-09-22 16:51

9月21日，明略科技宣佈旗下自主研發的 GUI 大模型 Mano 在業內公認的兩大挑戰性基準測試——OSWorld與 Mind2Web 中，雙雙取得了創紀錄的 SOTA 成績。這一成績不僅讓 Mano 成為通用 GUI 智能體的新範式，也意味着自動化邊界又被推遠了一大步。

刷新兩大榜單紀錄

在OSWorld-Verified 的 Foundation E2E GUI & Specialized Model 測試中，Mano 單次運行成功率達到 40.1%，整體表現均值為 41.6 ± 0.7%，超過 qwen、GUI-Owl、opencua 等全球同類模型。

另一項Mind2Web 基準覆蓋 137 個網站、2350 余項真實任務，涉及訂機票、填寫表格、在線購物等複雜操作，對模型的元素精度（Element Accuracy）、步驟成功率（Step SR）提出了極高要求。Mano 在這一測試中同樣表現突出，尤其在面對不斷變化的 DOM 結構和多樣化場景時，展現出卓越的適應能力。

三大核心技術

1. 在線強化學習Mano 在 GUI 交互領域首次提出了在線強化學習的訓練範式，並推出訓練數據自動採集的「探索器」，這兩大核心創新為其實現前所未有的圖形界面交互性能，奠定了堅實基礎。

2. 自動化訓練數據採集明略科技搭建虛擬環境集羣，利用插件和 DOM 提取器自動生成交互軌跡、元素信息和語義標註，大幅提高了訓練數據的多樣性和真實性。

3. 三階段訓練流程Mano 採用監督微調（SFT）、離線強化學習（Offline RL）、在線強化學習（Online RL）的三階段體系，將推理能力和任務適應性有機結合，解決了傳統模型難以應對動態場景的問題。

引領 GUI 智能體新範式

隨着生成式 AI 向「能動性」邁進，GUI 智能體正在成為人機交互的新方向。Mano 在「雙榜第一」的成績背后，是明略科技對智能體長期深耕的結果：從數據採集到訓練範式，從實驗室場景到真實複雜環境，Mano 都展現出可擴展性和穩定性。

明略科技表示，將繼續在數據採集、訓練推理整合、驗證碼處理等領域探索，推動 Mano 在真實應用和端側部署中的進一步優化，為企業的智能化轉型提供強有力的支持。

正如本次成果所示，中國企業完全有能力在全球前沿 AI 領域開闢出屬於自己的技術高地。

明略科技 Mano 大模型斬獲「雙榜第一」，帶來 GUI 智能體新範式

推薦文章

美股機會日報 | 阿里發佈千問3.5！性能媲美Gemini 3；馬斯克稱Cybercab將於4月開始生產

港股周報 | 中國大模型「春節檔」打響！智譜周漲超138%；鉅虧超230億！美團周內重挫超10%

一周財經日曆 | 港美股迎「春節+總統日」雙假期！萬億零售巨頭沃爾瑪將發財報

一周IPO | 賺錢效應持續火熱！年內24只上市新股「0」破發；「圖模融合第一股」海致科技首日飆漲逾242%

從軟件到房地產，美國多板塊陷入AI恐慌拋售潮

Meta計劃為智能眼鏡添加人臉識別技術

危機四伏，市場卻似乎毫不在意

財報前瞻 | 英偉達Q4財報放榜在即！高盛、瑞銀預計將大超預期，兩大關鍵催化將帶來意外驚喜？