
文章圖片

機器之心報道
機器之心編輯部
谷歌最近發布了一項關于其 AI 模型 Gemini 能源消耗的研究報告 。
博客地址:https://cloud.google.com/blog/products/infrastructure/measuring-the-environmental-impact-of-ai-inference 技術報告:https://services.google.com/fh/files/misc/measuring_the_environmental_impact_of_delivering_ai_at_google_scale.pdf報告中指出 , 處理一個中位數的 Gemini 文本提示僅消耗約 0.26 毫升水(約五滴)、0.24 瓦時電力(相當于觀看電視不到九秒) , 并產生 0.03 克二氧化碳排放 。
注:中位數(Median)是統計學中用于描述數據集中趨勢的指標之一 。 它是指將一組數據按大小順序排列后 , 位于中間位置的數值 。 這里指研究人員在對多次 Gemini 處理文本提示的資源消耗進行測量后 , 將所有的消耗數據(水量、電力、碳排放)分別進行了排序 。
谷歌表示 , 他們在 2024 年 5 月至 2025 年 5 月期間 , 已將單個文本提示的能耗降低了 33 倍 , 碳足跡減少了 44 倍 。
谷歌還強調 , 其測量方法比傳統方式更為全面 , 不僅計算了 AI 加速器在活躍狀態下的能耗 , 還納入了服務器待機、輔助硬件消耗以及數據中心冷卻和電力分配等總開銷 。
谷歌將這些較低的數值歸功于其「全棧式」效率優化方法 , 涵蓋模型架構、算法、硬件等多個層面 。 具體而言:
在模型架構層面:Gemini 基于 Transformer 架構 , 相較于此前最先進的語言建模架構 , 效率提升達 10 至 100 倍 。 此外 , 谷歌還采用了一些其他優化方案 , 例如 MoE 和混合推理模式 。
在算法層面:谷歌采用 AQT(Accurate Quantized Training) 等方法 , 在不降低響應質量的前提下 , 最大化效率并減少推理過程中的能耗 。
此外 , 谷歌還通過推測性解碼等技術 , 讓小模型先行預測并交由大模型快速驗證;蒸餾等技術則以更強能力的大模型作為教師模型 , 打造出更輕量高效的 serving 模型(如 Gemini Flash 與 Flash-Lite) 。
在硬件層面:十多年來 , 谷歌從零開始設計 TPU , 目標是實現每瓦性能的最大化 。 同時 , 谷歌還對 AI 模型與 TPU 進行協同設計 , 確保軟件能充分發揮硬件優勢 , 也讓硬件在未來與 AI 軟件配套時能夠高效運行 。 谷歌最新一代的 TPU:Ironwood , 相比最早公開的 TPU 能效提升 30 倍 , 在推理任務中的能效也遠遠超過通用 CPU 。
軟件層面: XLA 機器學習編譯器、Pallas 內核以及 Pathways 系統 , 使得通過高級語言(如 JAX)編寫的模型計算能夠高效運行在 TPU 推理硬件上 。
超高效的數據中心:Google 的數據中心在行業中屬于最為高效的一類 , 整個平臺的平均 PUE(fleet-wide average)為 1.09 。
在冷卻系統方面 , 谷歌也不斷優化 , 在能耗、水耗與碳排之間實現本地化平衡 , 指導冷卻方式選擇 , 并在水資源緊張地區限制用水量 。
專家不太認可
盡管谷歌展示了其在提升單位效率方面的努力 , 但多位專家對該研究的方法論和結論的完整性提出了質疑 。
忽略間接水資源消耗
加州大學河濱分校副教授 Shaolei Ren 和 Digiconomist 創始人 Alex de Vries-Gao 指出 , 報告最大的遺漏之一是未計算「間接用水量」 。
谷歌的 0.26 毫升估算僅包括數據中心用于冷卻服務器的直接用水 。 然而 , 為數據中心供電的發電廠(無論是天然氣還是核電)本身在冷卻和驅動渦輪機時也需要消耗大量水資源 。
De Vries-Gao 形容谷歌公布的數據「基本上只是冰山一角」 , 因為發電環節的用水量往往遠超數據中心的直接消耗 。
碳排放核算不完整
專家們還指出 , 谷歌在碳排放方面僅分享了「基于市場」的測量方法 , 該方法允許公司通過購買可再生能源證書來抵消其碳排放 。 然而 , 這并未完全反映其對當地電網的實際影響 。
專家認為 , 谷歌應遵循國際公認的《溫室氣體核算體系》標準 , 同時納入「基于地理位置」的碳排放數據 。 該指標能更真實地反映出數據中心運營所在地電網的清潔能源與化石能源組合所帶來的實際排放量 。 Ren 教授表示:「這才是基本事實 。 」
誤導性的數據比較
谷歌在報告中將其極低的水耗數據與 Ren 教授先前研究中高達 50 毫升的數據進行對比 , 稱其結果「低了幾個數量級」 。 Ren 教授認為這種比較是「驢唇不對馬嘴」 , 因為他此前的研究包含了直接和間接的總用水量 , 而谷歌只計算了前者 。
【谷歌Gemini一次提示能耗≈看9秒電視,專家:別太信,有誤導性】此外 , 谷歌使用了「中位數」來防止異常值扭曲結果 , 而以往研究多采用「平均值」 。 專家批評谷歌未能提供計算中位數的具體數據(如提示的詞數或 token 數量) , 使得外部難以驗證其結果的代表性 。
宏觀視角下的「杰文斯悖論」
盡管單個 AI 提示的效率在不斷提升 , 但專家們警告 , 這可能導致一個被稱為「杰文斯悖論」的現象:效率的提高反而可能刺激更多的使用 , 從而導致總體的資源消耗和污染不降反增 。
這一擔憂在谷歌自己的可持續發展報告中得到了印證 。 數據顯示 , 隨著公司大力發展 AI , 其「基于雄心的碳排放量」自 2019 年以來增長了 51% , 僅去年一年就增長了 11% 。
De Vries-Gao 直言:「如果你看看谷歌公布的總數據 , 情況其實非常糟糕 。 」 他認為 , 此次發布的 Gemini 效率報告「并沒有說明故事的全貌」 。
對此你有什么看法呢?歡迎在評論區留言 。
參考鏈接:
https://cloud.google.com/blog/products/infrastructure/measuring-the-environmental-impact-of-ai-inference
https://www.theverge.com/report/763080/google-ai-gemini-water-energy-emissions-study
推薦閱讀
- 蘋果AI華人總監跳槽Meta,核心團隊再-1,庫克被迫求助谷歌
- 李楠點評谷歌Pixel 10:這才是真正的AI手機 友商都是噱頭
- 谷歌的一個小調整,揭開了手機快充的真面目
- 谷歌Pixel 10系列發布,搶先蘋果發3nm N3P工藝
- AI有多耗電?谷歌:一次文字回答平均耗電0.24Wh
- Touch ID+新芯片,蘋果Apple Watch正準備迎來一次真正的大升級
- 谷歌技術報告披露大模型能耗:響應一次相當于微波爐叮一秒
- 谷歌全新小型圓形音箱曝光,或將對標HomePod Mini
- 谷歌AI硬件全家桶爆更!買手機送AI,發3nm芯片、折疊屏,硬剛三星蘋果
- 還是兩款小屏旗艦!谷歌Pixel 10系列登場,電池最高僅5200mAh
