熱門資訊> 正文
2025-10-27 12:31
作者 | Sergio De Simone
譯者 | 田橙
Google Research 近日宣佈開源 Coral NPU 平臺,這是一套面向硬件工程師與 AI 開發者的全棧開源方案,幫助他們克服當前阻礙人工智能在可穿戴設備和邊緣設備中落地的瓶頸,包括性能受限、生態碎片化以及用户信任缺失等問題。
Coral NPU 的核心目標,是讓全天候 AI 應用能在電池供電的設備上高效運行,同時為高性能場景提供靈活配置選項,實現能耗與算力的平衡。
要讓 AI 真正發揮「助理」的作用,比如主動幫用户規劃日程、實時翻譯對話,或理解所處的物理環境,它必須能夠在用户佩戴或攜帶的設備上本地運行。這一需求帶來了根本挑戰:如何在電量受限的邊緣設備中嵌入環境感知型 AI,讓設備脱離雲端依賴,從而實現私密、安全、真正全天候的智能體驗。
Google 研究人員指出,使用 Coral NPU 構建的硬件設備,能夠支持多種 AI 應用場景,包括用户活動與環境感知、音視頻處理(如語音識別、實時翻譯、人臉識別)以及手勢識別等。
在將 AI 融入可穿戴設備和邊緣設備的過程中,Coral NPU 平臺聚焦解決三大關鍵問題:
彌合邊緣設備有限算力與前沿大模型高需求之間的鴻溝;
緩解設備生態碎片化帶來的開發難題,統一不同廠商的專有芯片與硬件環境;
確保用戶數據免受未授權訪問,強化隱私保護。
在架構層面,Coral NPU 通過反向設計理念重新定義芯片邏輯:不再優先傳統的標量計算,而是將重點放在 機器學習矩陣引擎上,從底層硅片開始為 AI 優化,實現更高效的本地推理性能。
在隱私防護方面,Coral NPU 採用 CHERI 等技術手段,通過精細化的內存級安全機制與可擴展的軟件隔離體系,構建由硬件強制執行的安全沙箱,確保用戶數據安全。
該平臺基於符合 RISC-V 指令集架構(ISA) 的一組 IP 模塊構建,其基礎設計即可在僅消耗數毫瓦功率的情況下,達到每秒 512 GOPS(十億次運算) 的性能。相比之下,早期的非開源版 Google Coral 可實現 4 TOPS(萬億次運算),但功耗約為 1 瓦。
Coral NPU 平臺包含三大核心組件:
管理數據流的標量核心;
兼容 RISC-V 向量指令集的向量執行單元;
用於加速神經網絡計算的矩陣執行單元。
在編程層面,Coral NPU 架構與現代 C 編譯器(如 IREE 與 TFLM)深度集成,並支持多種機器學習框架,包括 TensorFlow、JAX 和 PyTorch。
為進一步提升性能,Google 研究團隊開發了一整套複雜的工具鏈:使用 TensorFlow、JAX 或 PyTorch 構建的機器學習模型,會先被轉換為通用的中間表示(MLIR),再經過多層次的語義降級(progressive lowering),逐步接近硬件底層語言,最終編譯為二進制文件,實現高效部署。
值得一提的是,Google Research 還與 Synaptics 合作,共同打造了首款基於這一新架構的物聯網處理器,為 Coral NPU 的落地提供了首個樣本。
目前,Coral NPU 平臺已在 GitHub 開源。