熱門資訊> 正文
2025-09-10 17:07
在全球科技行業努力應對人工智能應用和數字技術帶來的巨大能源消耗之際,微軟的研究人員可能已經找到了一個很有希望的解決方案。微軟英國劍橋研究院的一個團隊與劍橋大學的合作者成功開發了一款新型的模擬光學計算機(Analog Optical Computer, AOC),該計算機利用光的特性進行計算,有望在處理特定的人工智能和優化任務時,將能源效率提升高達 100 倍。相關研究成果已於 2025 年 9 月 3 日發表在《自然》(Nature)上。
隨着各行各業對人工智能和大規模數據處理的依賴日益加深,傳統數字計算機的能源消耗和數據傳輸瓶頸問題變得愈發突出。數字計算在處理複雜的優化問題和大規模 AI 模型推理時,往往需要消耗大量的電力,並受到數據在處理器和內存之間移動速度的限制,即所謂的「馮·諾依曼瓶頸」。爲了突破這些限制,科學界一直在探索新的計算範式,而模擬計算,特別是利用光子進行計算的光學計算,被視為一個極具潛力的方向。
微軟研發的這款 AOC 正是基於這一理念。它並非一臺通用計算機,而是一種專用計算設備,旨在高效解決兩類關鍵問題:人工智能推理(AI Inference)和組合優化(Combinatorial Optimization)。與依賴電子在「0」和「1」之間切換的數字計算機不同,AOC 利用光在通過光學元件時物理特性的連續變化來進行計算。這一模擬過程,避免了在數字與模擬信號之間進行耗能且耗時的轉換。
該 AOC 系統的核心架構結合了三維光學系統和模擬電子器件。其基本工作原理是通過一個微型發光二極管(microLED)陣列來代表輸入數據或變量,這些光源發出的光線經過複雜的透鏡系統,投射到空間光調製器(Spatial Light Modulator, SLM)上。空間光調製器在這里扮演着關鍵角色,其上的每個像素可以被編程來調整通過光線的強度,從而實現輸入數據與預設權重(或問題參數)的乘法運算。
隨后,經過調製的光線被另一組透鏡匯聚到光電探測器陣列上,完成加法運算。整個過程在物理層面瞬時完成了大規模的矢量-矩陣乘法,這是許多 AI 和優化算法中最為核心和計算密集的部分。模擬電子電路則負責處理非線性激活函數、反饋和迭代等其余的計算步驟。
圖丨微軟的研究人員,從左至右分別是 Jiaqi Chu、Francesca Parmigiani 和 James Clegg,已演示了一臺可工作的 256 權重光學計算機(中)(來源:Microsoft)
這種光電混合的模擬計算方式,使得 AOC 能夠在一個統一的平臺上,高效地執行 AI 推理和組合優化任務。其關鍵創新之一是一種被稱為「快速定點搜索」(rapid fixed-point search)的機制。在 AI 模型推理中,系統通過迭代快速收斂到一個穩定的「定點」,這個定點就代表了模型的輸出結果。
在解決優化問題時,這個定點則對應於問題的最優解或近似最優解。這種迭代過程的本質使其對模擬計算中固有的噪聲具有很強的魯棒性,因為每一次迭代都會將計算結果拉向正確的「吸引子」(attractor),從而有效抵消噪聲的干擾。
爲了驗證 AOC 的實際應用能力,研究團隊進行了一系列案例研究。在一個與微軟健康未來團隊合作的項目中,他們利用 AOC 的「數字孿生」(Digital Twin)——一個精確模擬硬件行為的軟件模型——來處理醫學圖像重建任務。結果顯示,該技術有潛力將核磁共振成像的掃描時間從 30 分鍾大幅縮短至 5 分鍾,這對於提升醫療效率和改善患者體驗具有重大意義。
在金融領域,微軟與巴克萊銀行(Barclays)合作,將 AOC 應用於解決複雜的金融交易結算問題。這是一個典型的組合優化難題,需要在滿足各種法律和信貸約束的條件下,找到最大化結算交易數量或價值的最佳方案。在一個包含 46 筆交易和 30 個約束條件的測試案例中,AOC 硬件成功找到了全局最優解,其表現甚至優於一些量子計算硬件在該問題上的嘗試。
除了這些複雜的優化任務,該原型機也展示了其在 AI 推理方面的能力。研究團隊成功地在 AOC 上運行了針對手寫數字(MNIST)和時尚商品(Fashion-MNIST)圖像識別的神經網絡模型,以及非線性迴歸任務。測試結果顯示,AOC 硬件的推理結果與數字孿生模型的模擬結果有超過 99% 的一致性,證明了從數字環境訓練模型,再部署到模擬光學硬件上的可行性。
目前,這台 AOC 原型機的規模還相對較小,其硬件能夠處理的權重數量為 256 個,通過特定技術可以擴展到 4096 個。研究人員指出,要處理現實世界中更大規模的應用,例如驅動大型語言模型或解決更復雜的工業優化問題,硬件的可擴展性需要達到數億甚至數十億個權重。
儘管面臨挑戰,但研究團隊對 AOC 的未來擴展性持樂觀態度。他們指出,這台原型機的一個顯著優勢是其構建材料大多是消費級的成熟技術,例如智能手機攝像頭中的傳感器、微型 LED 和光學鏡片等。這不僅能降低製造成本,也意味着未來的大規模生產可以利用現有的供應鏈。
研究團隊設想,未來的 AOC 系統將採用模塊化設計,通過集成多個小型的光電計算模塊來處理更大規模的矩陣運算。據他們預測,一個由 25 個模塊組成、能夠處理 1 億個權重的 AOC 系統,其功耗約為 800 瓦,而計算速度可達到每秒 400 千萬億次運算(Peta-OPS),能效預計可以達到每瓦 500 萬億次運算(TOPS/W),這比目前最先進的圖形處理器(GPU)在同等精度下的效率高出超過 100 倍。
參考資料:
1.https://www.nature.com/articles/s41586-025-09430-z
運營/排版:何晨龍