熱門資訊> 正文
2025-10-12 17:50
財聯社10月12日訊(編輯 牛佔林)馬斯克旗下的人工智能公司xAI正在加速構建所謂的「世界模型(world models)」,加入Meta與谷歌等競爭對手的行列,開發能夠理解、構建並操控物理環境的AI系統。
據悉,xAI在今夏從英偉達挖來多名專家,致力於構建下一代AI模型。這類模型通過視頻和機器人數據進行訓練,以便理解現實世界的運行規律。
業界認為,世界模型有望讓AI的能力突破當前依賴文本訓練的大語言模型侷限,這些大語言模型支撐着諸如ChatGPT和Grok等熱門AI工具,而世界模型技術終將助力創造超越人類的「通用人工智能」(AGI)。
世界模型是實現空間智能的核心,通過整合多模態數據,為空間智能技術在立體空間中進行推理和操作提供內在的環境表徵,其也被認為是物理推理的基礎,可以通過模擬未來狀態從而更加接近類人智能,彌合人與機器之間的認知對齊差異。
兩位知情人士透露,xAI正在研發的世界模型首要目標是用於遊戲領域,可自動生成交互式的3D環境。其中一人補充稱,該技術也可能被應用於機器人AI系統。
xAI已聘請了來自英偉達的兩位人工智能研究員——Zeeshan Patel與Ethan He。英偉達憑藉其Omniverse平臺在世界模型技術方面處於領先地位,該平臺能夠創建並運行虛擬仿真環境。
一些科技公司對世界模型寄予厚望,認為其有望讓AI從軟件和虛擬空間走向物理世界,驅動諸如類人機器人等產品。上個月,英偉達表示,世界模型的潛在市場規模可能接近當今全球經濟總量。
馬斯克在社交平臺X上發帖稱,xAI計劃在明年年底前推出一款「由AI生成的優秀遊戲」,以兑現他去年設定的目標。
本周二,xAI發佈了其最新的圖像與視頻生成模型,宣稱進行了「大規模升級」,並已向用户免費開放。
據瞭解,目前的視頻生成模型主要是通過學習訓練數據中的模式來預測並生成視頻幀畫面,如OpenAI的Sora。而世界模型的進步在於,它能夠具備對物理規律及物體交互的因果理解能力,能在不同環境中實現實時推理與反應。
xAI正在招聘圖像與視頻生成方向的技術人才,該團隊旨在「打造超越文本的神奇AI體驗」,讓AI能夠理解並生成跨圖像、視頻與音頻的多模態內容。
這些崗位的薪酬範圍為18萬至44萬美元。此外,xAI還開放了一項名為「視頻遊戲導師」的職位,職責是訓練Grok生成視頻遊戲,並讓用户體驗「AI輔助遊戲設計」,時薪介於45至100美元。
然而,構建世界模型仍是一項巨大技術挑戰。要找到足夠豐富的數據來逼真地模擬現實世界、並以此訓練模型,至今仍被證明是既困難又昂貴的。