繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

馬斯克從英偉達挖人做AI遊戲!第一步:研發世界模型

2025-10-13 09:35

衡宇 發自 凹非寺

量子位 | 公眾號 QbitAI

馬斯克的xAI也入局世界模型了

想必聽到這個消息的Meta、Google DeepMind一定會緩緩打出一個問號:衝我們來的?

據《金融時報》(FT)報道,爲了增加這場「世界模型大混戰」的贏面,今年夏天,xAI已經從英偉達挖來了多名資深研究員來助陣。

另一邊,在悄然下場世界模型后,馬斯克幾天前又在𝕏上再次重申了去年定下的那個「小目標」——

2026年年底前,xAI會發布一款偉大的AI生成遊戲。

Stability AI創始人EMostaque在自己的𝕏上列出這樣一組數字

OpenAI今年收入約100億美元,視頻遊戲行業今年收入約2000億美元。

馬斯克呀馬斯克,Attention is all you need(狗頭)

從英偉達那兒挖人,開搞!

世界模型是近兩年全球AI巨頭&實驗室們的新戰場,Google DeepMind、Meta、NVIDIA、李飛飛等都在做。

如今,xAI也來了。

而它的第一步,就選擇了去英偉達挖老黃牆腳——

今年夏天,xAI至少僱傭了兩位來自英偉達的研究人員:Zeeshan PatelEthan He

其中,Zeeshan Patel今年5月碩士畢業於UC伯克利,研究主要面向深度學習、生成模型和物理人工智能。

加入xAI前,他先在蘋果AI/ML部門從事基礎模型研究,后又加入英偉達研究院從事生成式世界模型研究。

在英偉達工作期間,Zeeshan Patel專注於大規模多模態模型與訓練框架的研發

Ethan He,本科畢業於西安交通大學,而后前往CMU攻讀計算機視覺的碩士學位,最后滿績畢業。

目前,他的Google Scholar被引數為8495。

2019年到2021年期間,Ethan He在FaceBook AI從事研究工程師,工作內容主要包括大規模視頻自監督學習、視頻基礎模型等。

2023年,他加入英偉達,工作內容均與MoE模型、多模態模型和世界模型有關。

今年7月,他正式加入xAI。

若説這兩人有什麼共同點,那就是兩人此前都在英偉達參與了Omniverse平臺的核心開發工作

這個平臺是全球最成熟的仿真平臺之一,被稱作「通往物理世界的數字平行宇宙」。

簡單來説,Omniverse是英偉達打造的物理一致性仿真系統,廣泛應用於機器人訓練、3D 建模、數字孿生、自動駕駛等領域。

它能在虛擬世界中精確地模擬現實物理規律,讓AI在不觸碰現實的情況下,就能學會如何與世界互動。

——而世界模型需要的就是這樣的能力

Omniverse與世界模型訓練/評測天然契合,難怪xAI內部人士透露,馬斯克計劃在xAI將英偉達在圖形與物理模擬領域的積累,應用到自家的世界模型體系中。

入局世界模型要干啥?

「世界模型」這個概念,其實最早可以追溯到強化學習,意思是讓AI先在腦海中模擬出一個世界,再去規劃行動、預測結果。

時至今日,它被不少業內人士視為AGI的核心底座。

AI教母李飛飛對世界模型的定義則是源自於人類自然形成的世界心智模型。

指的是一種AI系統能夠真正理解和推理物理3D世界的模型,而不僅僅侷限於文本處理。

世界模型能讓AI理解3D結構、形狀和組合性,從而推動機器人技術、創意產業和計算的未來發展。

在李飛飛看來,世界模型不僅能生成和重建持久存在、可導航的3D環境,還能支持多種應用,實現更大規模的虛擬世界和多元宇宙的構建。

在過去一年,這個方向幾乎成了AI巨頭和實驗室的兵家必爭之地。

  • DeepMind推出Genie 3,能從一張圖片或一段文字,直接生成可交互的 2D 遊戲世界;

  • Meta發佈V-JEPA-2,讓模型在視頻中預測未來幀、理解物理因果;

  • 英偉達自家也在強化世界模型,用於機器人訓練與數字孿生;

  • ……

那麼,馬斯克攜xAI下場,到底想干啥?

知情人士消息,xAI入局世界模型后的的首批落點可能是電子遊戲

目前,團隊正在嘗試讓AI自動生成自適應、逼真的3D場景,可以根據玩家行為實時變化的那種。

這與馬斯克自己設下的目標完美呼應——到2026年底,推出一款由世界模型驅動的AI生成遊戲。

一位用户在𝕏上留言稱:「AI在遊戲開發中的效率很高,能讓創造力自由流動,這很有道理。」

與此同時,xAI內部也正在為此組建一支全模態團隊(Multimodal Team),專門研究圖像、視頻、音頻的綜合理解與生成。

他們近期公開的招聘信息顯示,這支團隊包括多個方向:

  • Member of Technical Staff – Multimodal(Audio),職責涵蓋音頻理解、生成與評測;
  • Member of Technical Staff – Multimodal Understanding,薪資區間18萬–44萬美元/年,側重於多模態建模與數據系統。

除此之外,還有一個職位在業內引發熱議,Video Games Tutor,即電子遊戲導師。

相關招聘頁面寫得很直接:

時薪45–100美元,向模型講解電子遊戲機制、敍事邏輯、任務設計。

看來,馬斯克似乎打算讓人類專家教模型怎麼玩遊戲、怎麼設計任務、如何構建可交互世界。

馬斯克本人在多次公開發言中提到,xAI的使命是「讓AI理解宇宙的本質」。而世界模型正是通向理解宇宙的必經之路。

有了世界模型,AI不再只用來生成內容,而能在內部模擬出一個真實世界的副本。

這意味着它既可以驅動AI遊戲,也可以驅動智能體、自動駕駛乃至具身智能機器人。

從這一點上來看,xAI、特斯拉、Neuralink、𝕏之間的關係也變得微妙——

xAI研發模型,特斯拉擁有機器人和自動駕駛數據,Neuralink提供腦機接口𝕏則是社交與實時反饋的平臺。

如果這些板塊能通過世界模型互通,馬斯克的AI帝國,將真正形成閉環

參考鏈接:

[1]https://www.ft.com/content/ac566346-53dd-4490-8d4c-5269906c64ee

[2]https://x.com/EMostaque/status/1977352468087320714

[3]https://www.zeeshanp.me/research/

[4]https://www.linkedin.com/in/ethanhe42/

(聲明:本文僅代表作者觀點,不代表新浪網立場。)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。