繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

谷歌Gemini一次提示能耗≈看9秒電視,專家:別太信,有誤導性

2025-08-22 12:56

(來源:機器之心)

谷歌最近發佈了一項關於其 AI 模型 Gemini 能源消耗的研究報告。

  • 博客地址:https://cloud.google.com/blog/products/infrastructure/measuring-the-environmental-impact-of-ai-inference

  • 技術報告:https://services.google.com/fh/files/misc/measuring_the_environmental_impact_of_delivering_ai_at_google_scale.pdf

報告中指出,處理一箇中位數的 Gemini 文本提示僅消耗約 0.26 毫升水(約五滴)、0.24 瓦時電力(相當於觀看電視不到九秒),併產生 0.03 克二氧化碳排放。

注:中位數(Median)是統計學中用於描述數據集中趨勢的指標之一。它是指將一組數據按大小順序排列后,位於中間位置的數值。這里指研究人員在對多次 Gemini 處理文本提示的資源消耗進行測量后,將所有的消耗數據(水量、電力、碳排放)分別進行了排序。

谷歌表示,他們在 2024 年 5 月至 2025 年 5 月期間,已將單個文本提示的能耗降低了 33 倍,碳足跡減少了 44 倍。

谷歌還強調,其測量方法比傳統方式更為全面,不僅計算了 AI 加速器在活躍狀態下的能耗,還納入了服務器待機、輔助硬件消耗以及數據中心冷卻和電力分配等總開銷。

谷歌將這些較低的數值歸功於其「全棧式」效率優化方法,涵蓋模型架構、算法、硬件等多個層面。具體而言:

在模型架構層面:Gemini 基於 Transformer 架構,相較於此前最先進的語言建模架構,效率提升達 10 至 100 倍。此外,谷歌還採用了一些其他優化方案,例如 MoE 和混合推理模式。

在算法層面:谷歌採用 AQT(Accurate Quantized Training) 等方法,在不降低響應質量的前提下,最大化效率並減少推理過程中的能耗。

此外,谷歌還通過推測性解碼等技術,讓小模型先行預測並交由大模型快速驗證;蒸餾等技術則以更強能力的大模型作為教師模型,打造出更輕量高效的 serving 模型(如 Gemini Flash 與 Flash-Lite)。

在硬件層面:十多年來,谷歌從零開始設計 TPU,目標是實現每瓦性能的最大化。同時,谷歌還對 AI 模型與 TPU 進行協同設計,確保軟件能充分發揮硬件優勢,也讓硬件在未來與 AI 軟件配套時能夠高效運行。谷歌最新一代的 TPU:Ironwood,相比最早公開的 TPU 能效提升 30 倍,在推理任務中的能效也遠遠超過通用 CPU。

軟件層面: XLA 機器學習編譯器、Pallas 內核以及 Pathways 系統,使得通過高級語言(如 JAX)編寫的模型計算能夠高效運行在 TPU 推理硬件上。

超高效的數據中心:Google 的數據中心在行業中屬於最為高效的一類,整個平臺的平均 PUE(fleet-wide average)為 1.09。

在冷卻系統方面,谷歌也不斷優化,在能耗、水耗與碳排之間實現本地化平衡,指導冷卻方式選擇,並在水資源緊張地區限制用水量。

專家不太認可

儘管谷歌展示了其在提升單位效率方面的努力,但多位專家對該研究的方法論和結論的完整性提出了質疑。

忽略間接水資源消耗

加州大學河濱分校副教授 Shaolei Ren 和 Digiconomist 創始人 Alex de Vries-Gao 指出,報告最大的遺漏之一是未計算「間接用水量」。

谷歌的 0.26 毫升估算僅包括數據中心用於冷卻服務器的直接用水。然而,為數據中心供電的發電廠(無論是天然氣還是核電)本身在冷卻和驅動渦輪機時也需要消耗大量水資源。

De Vries-Gao 形容谷歌公佈的數據「基本上只是冰山一角」,因為發電環節的用水量往往遠超數據中心的直接消耗。

碳排放覈算不完整

專家們還指出,谷歌在碳排放方面僅分享了「基於市場」的測量方法,該方法允許公司通過購買可再生能源證書來抵消其碳排放。然而,這並未完全反映其對當地電網的實際影響。 

專家認為,谷歌應遵循國際公認的《温室氣體覈算體系》標準,同時納入「基於地理位置」的碳排放數據。該指標能更真實地反映出數據中心運營所在地電網的清潔能源與化石能源組合所帶來的實際排放量。Ren 教授表示:「這纔是基本事實。」

誤導性的數據比較

谷歌在報告中將其極低的水耗數據與 Ren 教授先前研究中高達 50 毫升的數據進行對比,稱其結果「低了幾個數量級」。Ren 教授認為這種比較是「驢脣不對馬嘴」,因為他此前的研究包含了直接和間接的總用水量,而谷歌只計算了前者。 

此外,谷歌使用了「中位數」來防止異常值扭曲結果,而以往研究多采用「平均值」。專家批評谷歌未能提供計算中位數的具體數據(如提示的詞數或 token 數量),使得外部難以驗證其結果的代表性。

宏觀視角下的「傑文斯悖論」

儘管單個 AI 提示的效率在不斷提升,但專家們警告,這可能導致一個被稱為「傑文斯悖論」的現象:效率的提高反而可能刺激更多的使用,從而導致總體的資源消耗和污染不降反增。

這一擔憂在谷歌自己的可持續發展報告中得到了印證。數據顯示,隨着公司大力發展 AI,其「基於雄心的碳排放量」自 2019 年以來增長了 51%,僅去年一年就增長了 11%。

De Vries-Gao 直言:「如果你看看谷歌公佈的總數據,情況其實非常糟糕。」 他認為,此次發佈的 Gemini 效率報告「並沒有説明故事的全貌」。

對此你有什麼看法呢?歡迎在評論區留言。

參考鏈接:

https://cloud.google.com/blog/products/infrastructure/measuring-the-environmental-impact-of-ai-inference

https://www.theverge.com/report/763080/google-ai-gemini-water-energy-emissions-study

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。