繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

被馬斯克譽為「地球上最聰明的AI」,果真如此嗎?

2025-02-18 19:57

轉自:上觀新聞

北京時間2月18日,在備受矚目中,由埃隆・馬斯克創辦的人工智能公司xAI推出了大模型Grok-3。之所以備受矚目,是因為在發佈會前夕馬斯克就將其描述為「地球上最聰明的AI」。

Grok-3真的如此聰明嗎?「這是xAI公司厚積薄發的一個版本,從發佈會上的多項測評指標來看確實是最高的,甚至超越DeepSeek R1也有相當幅度,肯定可以入列國際上的頭部大語言模型之一。」師從圖靈獎得主、深度學習創始人約書亞·本吉奧,上海交通大學人工智能學院副教授林洲漢接受了解放日報記者的採訪。

馬斯克在發佈會上解釋了Grok的由來,在羅伯特·海因萊因的小説《異鄉異客》中,它被一個在火星長大的角色使用,代表着充分而深刻地理解某事。

Grok-3在發佈會上的表現確實不負這一詞匯的內涵。它在數學、科學和編程的基準測試中,「優於目前所有已發佈的產品」,包括GPT-4o、Claude3.5 Sonnet、DeepSeek-V3等。

當它面對一個太空飛船任務——用3D動畫代碼演示從地球發射、着陸火星以及在下一個發射窗口返回地球的全過程時,Grok-3展現出了強大的推理和編程能力,且生成的代碼可以直接運行。馬斯克透露,Grok-3給的答案正是SpaceX公司未來探索火星的軌道。

讓林洲漢印象深刻的是,不同於DeepSeek的算法優化路徑和低成本訓練,Grok-3由一臺超級計算機訓練完成,由10萬-20萬個英偉達的H100 GPU驅動,提供了超過2億GPU小時的計算資源,是Grok-2的10多倍。

「這應該是全球首次在單一集羣里用這麼大規模的GPU來訓練單一模型,不知道xAI公司是如何保持模型在如此規模的集羣上訓練時的穩定性,發佈會上沒有透露具體細節。」林洲漢説。

Grok-3並非開源模型,X上的 Premium+訂閲者將是首批獲得訪問權限的人。

「不過,發佈會上展示的能力與實際落地后的用户反饋有時會有偏差。」林洲漢説,這是因為在開發過程中,研發人員會對公開測試集所涉及的領域做專門優化,如此一來測評分數會很高。比如,大多數語言模型都會針對數學奧賽題做專門優化,也會有一個很好的答題效果,但並不意味着這個模型就真的像奧賽金牌得主那麼聰明,一旦偏離奧賽題領域,模型能力可能會大幅下降。

「目前尚未出現能夠像人一樣能力泛化的大語言模型。一個模型的好壞不僅僅取決於它在訓練數據上的表現,更重要的是其在未見過的數據上的泛化能力。」林洲漢説。

值得關注的是,隨着DeepSeek等開源模型的崛起,猶如在大模型的湖面投下了一顆石頭,激起了層層漣漪。OpenAI公司發佈了o3-mini系列模型以及GPT-4.5和GPT-5的路線圖,Anthropic公司也表示將推出Claude-4。

在林洲漢看來,這意味着OpenAI公司不會一家獨大,其先進性正在弱化,不太能維持過去幾年的「斷層式領先」。與此同時,新冒出來的人工智能企業和模型,爲了避免同質化競爭,也將謀求不同的技術路線,進行差異化發展。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。