繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

英偉達發佈Cosmos Reason:AI機器人進入推理時代

2025-08-12 11:39

周一,英偉達(NVDA.O)發佈了一套面向機器人開發者的新一代全球AI模型、庫及其他基礎設施,其中最引人注目的是「Cosmos Reason」,一款擁有70億參數、面向物理AI應用與機器人的「推理型」視覺語言模型。

此次加入現有Cosmos世界模型陣列的還包括Cosmos Transfer-2,可加速從3D仿真場景或空間控制輸入生成合成數據,以及一款為速度優化的精簡版Cosmos Transfer。

英偉達在周一SIGGRAPH大會上表示,這些模型旨在用於創建合成文本、圖像和視頻數據集,以訓練機器人和AI代理。

據英偉達介紹,Cosmos Reason賦予機器人和AI代理「推理」能力,憑藉其記憶與物理理解能力,可「作為規劃模型推測具身智能體下一步可能採取的行動」。它可應用於數據整理、機器人規劃及視頻分析等領域。

例如,運行該模型的機器人手臂可以根據「麪包+烤麪包機」的場景,推斷出將麪包放進烤麪包機進行烘烤是最合理的下一步動作,並將思考邏輯轉化為操作指令。

Cosmos Reason在機器人及物理AI領域擁有多種應用場景。其數據整理與標註功能,可以幫助開發者自動化完成對海量且多樣化訓練數據集的篩選、評估與標註,大幅提升數據處理效率。

在機器人規劃與推理方面,藉助機器人視覺語言動作(VLA)模型,Cosmos Reason能夠支持有條理、循序漸進的決策制定。

機器人不僅可以理解所處環境,還能在接收到複雜指令時,將其拆解為可執行的任務,並依靠常識在陌生環境中完成執行。

此外,在視頻分析領域,基於英偉達Blueprint構建的視頻檢索與摘要AI代理,可從海量錄製或實時視頻中提取有價值的洞察,並進行根因分析,非常適合用於城市交通網絡、工廠及倉庫等場景。

公司還發布了新的神經重建庫,其中包括一種渲染技術的庫,允許開發者利用傳感器數據在3D中模擬真實世界。該渲染功能也將整合進開源模擬器CARLA,這是一款廣受開發者歡迎的平臺。此外,Omniverse軟件開發工具包也迎來了更新。

在機器人工作流方面,英偉達還推出了新服務器RTX Pro Blackwell Server,提供單一架構以支持機器人開發工作負載;DGX Cloud則是一個基於雲的管理平臺。

這些發佈顯示,這家芯片巨頭正加速進軍機器人領域,尋找繼AI數據中心之后AI GPU的下一個重要應用場景。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。