熱門資訊> 正文
2025-08-06 16:59
原標題:一家GPU初創公司浮出水面
據Raja Koduri在其社交媒體介紹,Oxmiq Labs Inc. 是一家全新的 GPU 軟件和 IP 初創公司,從隱形中脫穎而出。「我們組建了一支由 GPU 和 AI 架構師組成的世界級團隊,他們擁有 500 多年的綜合經驗。OXMIQ 的可許可 IP 從頭開始重新構建 GPU。」Raja Koduri説。
「我們希望成為下一代的 Arm」,Raja Koduri在接受路透社採訪時表示。
Oxmiq Labs指出,公司正在採用軟件優先的方法來構建其芯片設計,並開發了一種工具,允許為 Nvidia 的 CUDA 編寫的軟件程序在非 Nvidia 硬件上運行,「而無需修改代碼或重新編譯」。
「我們可能是硅谷 25+ 年來*家新的 GPU 初創公司,GPU 並不容易」,Raja Koduri説。
一款基於RISC-V的GPU
據Oxmiq Labs所説,現代計算已從根本上轉向多模態體驗,文本、音頻、視頻、圖像和 3D 環境無縫交互,GPU 架構成為這一轉變的基石。與處理特定任務的固定功能 AI 加速器不同,GPU 提供了這些不同模態所需的通用計算靈活性,同時通過標準化 API 和統一的內存模型與主流操作系統保持深度集成。這種架構優勢使 GPU 成為當前應用程序和新興多模態 AI 領域(其中異構工作負載必須協調處理)的必備計算引擎。
基於這個見解,OXMIQ專注於開發GPU硬件和軟件IP,並將其授權給感興趣的各方。
Oxmiq表示,可授權 GPU IP 從*性原理重新架構了 GPU,並融合了突破性技術,包括利用 RISC-V 內核的硅片納米代理、近內存和內存計算以及光傳輸。OXMIQ 為客户提供的解決方案,在多模態計算靈活性與下一代圖形和 AI 工作負載所需的根本性性能提升之間取得平衡。
在硬件方面,Oxmiq 提供了一個基於 RISC-V 指令集架構 (ISA) 的 GPU IP 核 OxCore,該核將標量、矢量和張量計算引擎集成在一個模塊化架構中,並支持近內存和內存計算功能。
Oxmiq 還提供基於chiplet的系統級芯片 (SoC) 構建器 OxQuilt,使客户能夠根據特定工作負載需求,快速且經濟高效地創建集成計算集羣橋接器(CCB,可能集成 OxCores)、內存集羣橋接器 (MCB) 和互連集羣橋接器 (ICB) 模塊的 SoC。
例如,用於邊緣應用的推理 AI 加速器可以封裝一個或兩個 CCB 和一個 ICB,推理 SoC 則需要更多 CCB、MCB 和 ICB,而用於 AI 訓練的大規模 SoC 則可能封裝數十個chiplet。Oxmiq 尚未透露其 OxQuilt 是僅支持構建多芯片集系統級封裝 (SiP),還是也可用於組裝單片處理器。
據該公司在官網介紹,OXMIQ 還提供完整的GPU 硬件 IP堆棧,為從邊緣設備和自主機器人中的物理 AI 到企業邊緣基礎設施和澤級數據中心的各種硅片解決方案提供支持。其可擴展的 GPU 核心OXCORE將標量、矢量和張量計算引擎集成在一個模塊化架構中,可根據特定工作負載進行定製,從而支持nano-agents、原生 Python 加速以及與 SIMT/CUDA 範式的兼容性。
OXCORE可通過OXQUILT chiplet 架構無縫擴展,從適用於緊湊型物理 AI 應用的單核到適用於數據中心的數千核。通過OXQUILT,客户可以根據自身需求配置*的計算、內存和互連比例,並顯著縮短上市時間,降低研發和生產成本,相比當前行業標準方法,大幅降低產品上市時間。
軟件是核心
Oxmiq Labs強調,從數十年的行業發展中吸取教訓,OXMIQ 秉承軟件優先戰略,通過與基於 OXMIQ IP 的硅片以及第三方 GPU 和 AI 加速器平臺兼容的全面軟件堆棧,優先考慮開發人員體驗。
據介紹,該軟件包旨在抽象異構硬件的複雜性,並支持在各種硬件平臺上部署 AI 和圖形工作負載,而不僅僅是那些使用公司 IP 的平臺。其中,OXCapsule是整個軟件生態的核心,是OXMIQ 的統一軟件生態系統,它抽象了硬件複雜性,可在不同的計算平臺上提供無摩擦的部署,消除了傳統上困擾異構環境的配置挑戰。
具體而言,這是一個統一的運行時和調度層,用於管理工作負載分配、資源平衡和硬件抽象。該層將應用程序封裝到獨立的環境中,該公司稱之為「異構容器」。這些容器被設計為獨立於底層硬件運行,使開發人員無需修改代碼庫或處理底層配置即可針對 CPU、GPU 和 AI 加速器進行開發。
OXPython則是 OXMIQ 的旗艦組件,它使基於 Python 的 NVIDIA CUDA AI 應用程序能夠在非 NVIDIA 硬件上無縫執行,無需修改代碼或重新編譯。OXPython 將於今年晚些時候在Tenstorrent 的AI 平臺上首次推出,目前正與多家供應商進行集成。OXPython展現了OXMIQ致力於打破硬件孤島、加速整個行業高性能計算普及化的決心。
換而言之,這將是一個兼容層,將以 CUDA 為中心的工作負載轉換為 Oxmiq 的運行時,並允許基於 Python 的 CUDA 應用程序在非 Nvidia 硬件上無需修改即可運行,無需重新編譯。
據瞭解,OXPython 最初不會在 Oxmiq 的 IP 上發佈,而是在 Tenstorrent 的 Wormhole 和 Blackhole AI 加速器上發佈。事實上,Oxmiq 的軟件堆棧從根本上設計為獨立於 Oxmiq 硬件,這是其戰略的核心部分。
Tenstorrent首席執行官 Jim Keller 也表示: 「我們很高興與 OXMIQ 合作開發他們的OXPython軟件棧。OXPython 能夠將 CUDA 的 Python工作負載引入 Wormhole和 Blackhole等 AI 平臺,這對於開發人員的可移植性和生態系統的擴展非常有利。這與我們讓開發人員開放並擁有整個 AI 棧的目標相一致。」
該公司在官網中強調,Oxmiq Labs致力於重構 GPU 全棧架構,從原子到代理,以滿足下一代遊戲、圖形和多模態 AI 的需求。公司開發可授權的 GPU 軟硬件 IP,通過集成突破性技術(包括基於 RISC-V 的硅片nano agents、近內存計算和內存計算、先進光傳輸以及其他創新技術)來平衡靈活性和性能。OXMIQ 的架構旨在實現從物理 AI 設備到數據中心規模的無縫擴展。
聯發科已經投資
除了Raja Koduri 以外,如他們所説,該公司已經聚合了一支*競爭力的團隊。
值得一提的是,Oxmiq Labs不但不像 AMD Radeon或 Nvidia GeForce 那樣打造消費級 GPU。與 Arm 或 Imagination Technology 不同,Oxmiq 也並未開發構建 GPU 所需的所有 IP 模塊:它不支持開箱即用的完整消費級圖形功能(例如紋理單元、渲染后端、顯示流水線、光線追蹤硬件、DisplayPort 或 HDMI 輸出),因此,如果 Oxmiq 授權用户計劃構建 GPU,他們必須自行在芯片中實現這些功能。
依賴於這些*團隊和積累,該公司也已從知名科技投資者(包括聯發科等移動和人工智能芯片領域的戰略參與者)處獲得 2000 萬美元種子輪融資,並已實現首輪軟件收入。OXMIQ強調,憑藉授權優先模式,避免了芯片初創公司依賴昂貴 EDA 工具和物理流片的鉅額資金需求,從而實現了*的資本效率。
聯發科高級副總裁 Lawrence Loh 表示:「OXMIQ 擁有令人印象深刻的遠見卓識和世界一流的團隊。公司的 GPU IP 和軟件創新將推動跨設備計算靈活性的新時代——從移動設備到汽車,再到邊緣 AI。」