熱門資訊> 正文
2025-09-29 15:02
財聯社9月29日訊(編輯 瀟湘)人工智能先驅們幾乎一致認為,世界模型對打造下一代人工智能正至關重要。許多人表示,該技術終將助力創造超越人類的「通用人工智能」(AGI)。
早在去年,斯坦福大學教授、人工智能「教母」李飛飛已籌集2.3億美元創立世界模型初創公司World Labs。英偉達首席執行官黃仁勛今年早些時候也表示,世界模型能助力實現「物理人工智能」,自主操控機器人、自動駕駛汽車等設備。
而就在上周,Meta官宣發佈了一款名為代碼世界模型(Code World Model)的LLM,探索如何使用世界模型改進AI代碼生成性能。Meta新成立的超級智能AI實驗室將與機器人團隊合作,構建一個「世界模型」,模擬現實世界物理規律,為機器人提供空間感知和精細操作能力,彌補現有機器人的不足。
在中國方面,全球知名增長諮詢公司Frost & Sulllivan近期發佈的《2025年中國世界模型發展白皮書》報告顯示,中國世界模型領域玩家已經超過10家。
不難看到,儘管當前大型語言模型和ChatGPT背后的AI技術備受矚目,但基於世界模型的人工智能正在前沿研究領域蓄勢待發,有望讓技術在人類生活中承擔全新角色。
這些投入能否如企業界領袖預言般催生「超級智能」尚不明朗。但短期內,世界模型無疑有望提升AI在當前薄弱環節的表現,尤其在空間推理領域。
從「書呆子」到「放眼看世界」
當下的AI就好比「書呆子」,它們所知的一切都來自可獲取的語言、圖像及視頻。要更進一步進化,它們必須具備「街頭智慧」,而這背后無疑需要「世界模型」大展拳腳。
世界模型是實現空間智能的核心,通過整合多模態數據,為空間智能技術在立體空間中進行推理和操作提供內在的環境表徵,其也被認為是物理推理的基礎,可以通過模擬未來狀態從而更加接近類人智能,彌合人與機器之間的認知對齊差異。
其中的關鍵在於,讓人工智能像人類和動物那樣,從環境中學習並將其抽象版本真實地呈現在「頭腦」中。為此,開發者需要通過模擬世界來訓練人工智能——這就如同通過玩《GT賽車》來學習駕駛,或通過玩《微軟飛行模擬》掌握飛行技巧。此類世界模型涵蓋了規劃行動、執行操作及預測未來所需的一切要素,包括物理規律與時間維度。
這種世界模型方法,其實已經對現實世界產生了潛在的巨大影響。風險投資公司Lightspeed的合夥人兼投資者Moritz Baier-Lentz表示,無人機戰爭、新型機器人和比人類更安全的自動駕駛車輛都正從中受益。
優步前AI業務負責人、經常批評當前AI模式的Gary Marcus指出,無論當今生成式人工智能接受多少數據訓練,它們只能建立世界運作的概率模型。本質上,當前人工智能學習的是輸入數據間的關聯性——無論是文字圖像,還是分子及其功能。這種對世界模糊的近似認知,似乎被混雜地編碼在AI「大腦」中,既包含數據本身,又包含大量關於數據處理的龐雜規則——而這些規則又往往殘缺不全或自相矛盾。
一個很好的例子是:一臺運行1979年程序的雅達利2600遊戲機,可以在國際象棋比賽中擊敗最先進的聊天機器人。這些聊天機器人往往會嘗試非法走法,並很快忘記棋子的位置。本質上,當今基於Transformer架構的人工智能是在進行預測,而不是邏輯推理。儘管它們已經通過無數盤遊戲和無數規則手冊的訓練,但仍然如此。
雅達利2600遊戲機之所以能獲勝,是因為它使用一個古老而簡陋的內部世界模型版本——一個數據庫——來保持棋子的位置準確。
連藍領的崗位也危險了?
現實世界無疑遠比受限的遊戲世界複雜得多。而爲了應對這些挑戰,科技巨頭們也正在進行新的嘗試。
谷歌DeepMind的研究人員着手打造一個系統,尋求以前所未有的逼真程度實現對現實世界的模擬。最終成果是,Genie 3(目前仍處於研究預覽階段,尚未公開發布)能夠僅憑文本提示,生成照片般逼真的開放世界虛擬景觀。你可以將Genie 3視為一種快速生成本質上類似開放世界電子遊戲的方法——可以儘可能忠實於現實世界。在這個虛擬空間中,新生人工智能「嬰兒」可以無休止地玩耍、犯錯,並學習如何實現目標,就像現實世界中的幼年動物或人類一樣。這個實驗過程被稱為強化學習。
DeepMind項目聯合負責人Jack Parker-Holder表示,Genie 3是一個系統的一部分,該系統可以幫助訓練未來駕駛機器人、自動駕駛汽車和其他「具身化」人工智能的人工智能。他補充稱,環境中可能充滿了人和障礙物:人工智能可以通過觀察人類在虛擬空間中的活動來學習如何與人類互動。
事實上,特斯拉CEO馬斯克可以説是最早拋出「世界模型」這一説法的人士之一。特斯拉爲了實現全球範圍內所有路況的自動駕駛,在感知跟決策中間,嵌入了一個AI模型,主要是構建一個虛擬環境,以便進行自動駕駛能力的學習和驗證。
而與之類似,總部位於多倫多的Waabi公司則構建了一個名為「Waabi World」的虛擬世界,專門用於訓練人工智能駕駛卡車。讓它們在模擬環境中反覆碰撞比在現實世界中嘗試一次要更為安全也更便宜。該公司首席執行官Raquel Urtasun表示,這可以讓人工智能記錄數百萬英里的虛擬駕駛里程。她補充稱,預計到今年年底,Waabi的軟件將能夠在真實道路上自動駕駛一輛真正的卡車。
目前,大語言模型似乎已經接管了白領工作中的一些職能,而具備世界模型智能的AI可能會接管更多工作——在過往,藍領工作一直以來相對安全,但隨着人工智能開發者對世界模型的深入研究,機器人可能會開始接手卡車司機、水管工或護理員等職位……