繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

陳天橋旗下AI公司MiroMind打造全球頂尖預測型大模型,性能登頂行業基準

2025-09-20 12:35

(來源:機器之心)

科技的走向、股市的漲跌、比賽的勝負、選舉的結果…… 在 AI 時代,未來還會像過去那樣不可知嗎?全球首個動態實時 LLM 智能體未來預測基準 FutureX 推出,被馬斯克稱為衡量智能的最佳標準。

9 月 18 日,全球創新企業家、慈善家陳天橋旗下的 MiroMind 團隊在這一 AI 未來大考中,連續第二周蟬聯冠軍。與專注文本輸出的生成式模型不同,MiroMind 採用記憶驅動機制,專為預測與決策設計,旨在打造全球最好的預測大模型。

科幻電影早已為我們描繪過可能性:《少數派報告》AI 預測犯罪,讓「未發生的事件」變得可防可控;《Her》智能系統能夠預測人類行為和選擇。今天,這些幻想正逐步照進現實。

長期以來,AI 評估大多停留在答案已知的靜態問題上,如同學生反覆練習往年高考試卷。然而,真正有價值的能力是對未知未來的準確預測。投資和規劃將不再依賴盲目試錯,可以提前洞察趨勢,把握機遇,有效規避風險,真正掌握主動權。畢竟,誰不曾幻想過回到過去,提前買入 Nvidia 或 Tesla 呢?

正如伊隆・馬斯克所説:「預測未來的能力是衡量智能的最佳標準。」讓 AI 具備像人類一樣在不確定環境下的決策能力,這正是通向 AGI 的重要一步。

首次打榜,Grok 取得第一名,MiroMind 為開源模型的第一。馬斯克為此興奮發文,稱之為最好的 benchmark 首次打榜,Grok 取得第一名,MiroMind 為開源模型的第一。馬斯克為此興奮發文,稱之為最好的 benchmark

FutureX 與 Prophet Arena:AI 智能體未來預測基準的誕生

不久前,字節跳動 SEED 團隊聯合斯坦福大學、復旦大學、普林斯頓大學共同推出 Future X,是全球首個動態實時 LLM 智能體未來預測基準。它從全球 200 多個高質量網站精選只有下周纔會有明確結果的問題,讓 AI 直面正的未來事件:股票價格的漲跌、體育比賽的勝負、政治選舉的結果、科技公司的戰略走向等。

這種評估方式的核心優勢非常顯著。AI 必須像人類分析師一樣,基於當前可獲得的信息,運用邏輯推理、趨勢分析和概率計算來做出預測。這一機制極大地推動了 AI 智能體在真實世界複雜場景中的實用能力提升,也成為衡量智能體系統核心智能水平的重要標杆。

Prophet Arena 則是另一個 AI 預測能力評估平臺,通過實時收集和分析真實世界事件,考察 AI 模型在不確定性推理、信息整合和概率預測等方面的表現。

MiroMind 如何成功預測未來

MiroMind 在 FutureX 榜單上表現驚艷。8 月第 3 周,首次參與即獲得第六名的成績。而在 9 月的提交中,更實現了雙重突破:搭載 GPT-5 的 MiroFlow 智能體框架在第 1 周和第 2 周連續奪得榜首,同時搭載自研模型 MiroThinker 的 MiroFlow 均位列前五,力壓眾多國際頂尖機構和閉源商業模型。

在測試中,MiroMind 成功預測了 2025 年 9 月 9 日 ATP 男子單打排名第 4-6 位的選手,其難點在於網球排名系統極為複雜,涉及積分計算、比賽結果、時間窗口等多個變量。

MiroMind 的模型在預測中制定了五步策略:

制定詳細預測計劃:模型首先展現了戰略規劃能力,制定了系統性的預測方案。

獲取基礎數據:通過網絡檢索獲取 9 月 1 日的男子網球 TOP 10 排名數據,建立預測基準線。

理解積分規則:深入研究比賽排名與積分的對應關係,特別對比了 2024 年與 2025 年的 dropping 規則,確保計算一致性。

動態信息更新:搜索 9 月 1 日之后的比賽成績,並分類處理:對已有結果的比賽,直接更新對應選手排名;對尚未結束的比賽,識別其可能影響。

概率分析與綜合判斷:多情景分析,針對尚未出結果的比賽,模型分析了 6 種可能情況;引入博彩網站概率數據,作為外部驗證基準;最終基於 outcome 和 probability 加權計算,得出最可能排名結果。

MiroMind 還成功預測了 2025 年 9 月 11 日 數字加密貨幣 Solana 將突破的一系列關鍵價格檔位,體現了模型在處理價格波動類問題上的系統建模能力與風險控制水平。這輪預測中,MiroMind 則是制定了六步策略:

構建市場基準線:聚合 CoinGecko、Coinbase、Binance、Kraken 等多平臺實時數據,明確 Solana 當前價格區間及近期價格走勢,建立精準預測起點;

量化短期波動空間:基於歷史數據計算年化波動率、平均日內振幅等關鍵指標,評估 Solana 在一天內可能達到的價格區間,判斷各檔位的突破概率;

梳理外部影響因素:系統檢索 9 月 10 日的宏觀經濟事件(如美國 PPI 發佈)、Solana 鏈上動態和潛在生態活動,評估是否存在可能引發劇烈波動的催化因素;

分析市場情緒信號:提取 OKX、Kraken 等平臺的永續合約資金費率與基差數據,判斷市場是否存在明顯的多空傾斜,作為重要情緒指標參考;

挑選穩健價格檔位:結合價格分佈、風險容差與市場結構,挑選那些在大多數行情路徑下都有可能成立的價格檔位,避開臨界邊緣值,確保預測結果穩健可靠;

交叉驗證與最終判斷:對比統計結果、衍生品信號與第三方市場預期,最終確定最優預測選項,兼顧穩健性與覆蓋率。

MiroMind 的登頂並非偶然,而是基於 AI 預測未來的幾項核心能力:

  • 信息洞察力:能快速抓取、理解和整合海量數據 —— 從股市行情到新聞動態,再到社交輿情。沒有全面信息,預測就是空想。

  • 邏輯推理與趨勢感知:能發現模式、識別因果、判斷趨勢。未來不是憑直覺,而是建立在嚴密邏輯和數據分析之上。

  • 概率與不確定性管理:能量化可能性、權衡風險,在不確定環境下做出最優判斷。未來充滿變數,聰明的預測是概率化的決策。

  • 跨領域整合能力:能把金融、政治、科技、社會等多領域信息融會貫通。未來事件往往是多因素交織,單一視角難以洞察全局。

建設最好的預測大模型和創新者平臺

MiroFlow 框架在 GAIA-Validation 上也取得了 82.4% 的優異成績,並在 HLE、BrowseComp 以及 xBench-DeepSearch 等基準測試中領先眾多國際對手。更值得關注的是,MiroFlow 提供了完全開源、可復現的框架和配置,致力於建設一個創新者平臺。這個平臺為研究者和開發者提供從基礎框架、模型到工具鏈的完整支持,使大家能夠自由實驗、快速迭代,並在多 Agent 協作、多模態理解等前沿領域進行探索。

MiroFlow 框架之外,MiroMind 團隊推出的自研旗艦基礎智能體模型(Agent Foundation Model)——MiroThinker,不僅具備強大的推理、決策和多模態理解能力,還能在多 Agent 協作中發揮核心作用,在各類榜單中已成為開源模型的引領者,並不斷縮小與閉源商業模型的差距。MiroThinker 很快將以完全開源的形式向全球開發者和研究者開放,提供可復現的模型和實驗環境。

陳天橋:持續投入,誠邀全球 AI 人才

陳天橋 盛大集團創始人、董事長兼CEO,天橋腦科學研究院創始人 陳天橋 盛大集團創始人、董事長兼CEO,天橋腦科學研究院創始人

從盛大,到天橋腦科學研究院,再到 All in AI,陳天橋四分之一個世紀以來持續探索人類未來科技的邊界:

  • 虛擬世界的創造者,1999 年創辦盛大,開創了中國網絡遊戲與網絡文學行業。

  • 人類大腦的探索者,2016 年創辦全球最大的私人腦科學機構天橋腦科學研究院,在腦機接口等基礎、前沿研究領域碩果累累。

  • 未來世界的塑造者,開展 AI + 長期記憶、AI 預測未來等全新前沿探索。目前 MiroMind 正在探索將長期記憶模塊深度嵌入模型,在複雜、多變的環境中做出更精準可靠的預測,實現真正的時間維度智能。

陳天橋説:「我們正在全力打造一個全球最好的預測大模型,讓 AI 記住過去,洞察未來。我們持續歡迎全球志同道合的 AI 優秀人才加入,共同創造未來。」

如果你對 MiroMind 在做的事情很感興趣,希望和他們一同用 AI 預測未來,可以通過以下方式聯繫他們:

  • MiroFlow 開源 Agent 框架:

    https://github.com/MiroMindAI/MiroFlow

  • MiroThinker 開源模型:

    https://github.com/MiroMindAI/MiroThinker

  • FutureX 榜單:https://futurex-ai.github.io/

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。