誰還敢說谷歌掉隊？2025年，它打了一場漂亮的翻身仗

2026-04-02 機器人人工智能芯片 ai Google

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

【誰還敢說谷歌掉隊？2025年，它打了一場漂亮的翻身仗】

文章圖片

文章圖片

編輯｜+0、張倩
在即將過去的 2025 年，谷歌在人工智能領域交出了一份頗具分量的成績單。
曾因「發表了 Transformer 卻痛失先機」而備受外界質疑，谷歌一度深陷「大模型掉隊」的輿論漩渦。但這一年，谷歌用一系列里程碑式的發布打了一場漂亮的翻身仗。它向世界證明， AI 不再只是陪聊的機器人，而是變成了能寫代碼、能做科研、甚至攻克前沿科學難題的「合作伙伴」。
看看 Demis Hassabis 曬出的這張年度成績單， Gemini 3、Genie 3、Veo 3、Nano Banana... 確實碩果累累。

同時，谷歌官方博客發布年終研究進展總結報告，詳細盤點了谷歌 2025 年的研究突破，作者包括 Jeff Dean、Demis Hassabis、James Manyika 。

博客地址：https://blog.google/technology/ai/2025-research-breakthroughs/#ai-models
在深入細節之前，我們先快速梳理谷歌本年度的幾大「殺手锏」。
模型側： Gemini 3 強勢登頂，邏輯推理與數學能力刷新紀錄， Flash 版本性價比超越前代 Pro 。硬件側：第七代 TPU Ironwood 算力暴漲，劍指英偉達；量子計算實現「量子回聲」突破。應用側： AI 不再只是 Chatbot ，通過 Antigravity 重塑編程，通過 Veo 3 和 Genie 3 徹底改變視頻生成與世界模擬。科學側： AlphaFold 五周年里程碑與諾貝爾化學獎的雙重加冕，奠定了 AI for Science 的領先地位。 Gemini Deep Think 也在數學奧賽（IMO）與編程競賽（ICPC）中雙雙達到金牌水平，標志著 AI 抽象推理能力的質變。以下是我們基于官方博文整理的詳細技術盤點：
AI 模型：谷歌訓出了奧特曼理想中的 GPT-5
今年 3 月， Gemini 2.5 的發布為全年的技術路線奠定了基礎。而 11 月正式面世的 Gemini 3 ，則被視為谷歌目前的巔峰之作。谷歌在模型推理、多模態理解以及運行效率等方面實現了多次實質性跨越。
作為谷歌目前性能最強的模型， Gemini 3 Pro 在邏輯推理領域表現尤為突出。它不僅迅速登頂 LMArena 排行榜，更在 Humanity’s Last Exam（旨在考察 AI 是否具備人類水平思考能力的嚴苛測試）中取得突破性成績。在數學領域，它以 23.4% 的準確率刷新了 MathArena Apex 的紀錄。

Gemini 3 在多項關鍵 AI 基準測試中處于最先進水平。
相關鏈接：https://blog.google/products/gemini/gemini-3/
緊隨其后的 12 月，谷歌推出了針對開發者和企業級市場的 Gemini 3 Flash 。這款模型延續了谷歌「后浪推前浪」的策略，即：下一代的 Flash 模型在性能上力求超越上一代的 Pro 模型。
數據顯示， Gemini 3 Flash 的綜合質量已經超越了今年 3 月發布的 Gemini 2.5 Pro ，但其成本大幅降低，延遲表現也得到了顯著優化。這種「高性價比」的策略，旨在讓更復雜的推理任務能夠以更快的速度和更低的門檻進入實際應用場景。

Gemini 3 Flash 價格及基準表。
相關鏈接：https://blog.google/products/gemini/gemini-3-flash/
除了閉源的 Gemini 系列，谷歌在開源領域也動作頻頻。 Gemma 家族在今年實現了從純文本到多模態的轉型。
通過增加上下文窗口、擴展多語言支持以及優化在單張 GPU/TPU 上的運行效率， Gemma 3 現已成為開發者在本地部署高性能 AI 時的首選工具之一。特別是 8 月發布的 Gemma 3 270M ，以其極小的參數規模提供了超高效率，標志著谷歌在邊緣側 AI 領域的技術沉淀。

相關鏈接：https://developers.googleblog.com/en/introducing-gemma-3-270m/
產品重構：AI 不再是工具
而是你的「合作伙伴」
2025 年是 AI 從「單一工具」向「核心效能」跨越的一年。 Google 通過在全線產品中注入強大的 Agentic 能力，推動 AI 從輔助角色轉變為實用型基礎設施，重新定義了人機協作的形態。
在軟件開發領域， Google 不再局限于提供輔助編碼工具，而是致力于構建能與開發者深度協作的智能體系統。 11 月發布的 Gemini 3 展現了令人印象深刻的代碼生成與邏輯理解能力。同期推出的 Google Antigravity 更是標志著 AI 輔助開發進入了一個新紀元 —— 它將開發流程從傳統的「工具輔助」升級為「智能體協作」，極大地釋放了開發者的創造力與生產力。

相關鏈接：https://antigravity.google/blog/introducing-google-antigravity
這種進化同樣清晰地體現在 Google 的核心產品矩陣中，貫穿了從硬件終端到信息檢索的每一個環節：
3 月， Search 迎來了重要變革，通過擴展 AI Overviews 并引入全新的 AI Mode ，重塑了用戶獲取與處理信息的方式。

8 月，備受矚目的 Pixel 10 正式亮相。得益于一系列 AI 原生功能的深度整合，它被評價為 Google 迄今為止最智能、最實用的手機終端。
而在生產力與知識管理領域，年底的一系列更新將體驗推向了新高度。隨著 11 月 Gemini 3 的底層賦能， Gemini App 迎來了智商與能力的雙重飛躍。與此同時， NotebookLM 也在同月重磅加入了 Deep Research 功能并支持了更多類型的數據源，使其從單純的筆記工具進化為能夠處理復雜信息流的專業級智能研究助手。

相關鏈接：https://blog.google/technology/google-labs/notebooklm-deep-research-file-types/
創意生成：終結「默片時代」
好萊塢要慌了
2025 年是生成式媒體發生變革的一年。 Google 通過發布一系列突破性的模型和工具，涵蓋視頻、圖像、音頻及虛擬世界構建，賦予了創作者前所未有的能力。
在視頻生成領域， 5 月發布的 Veo 3 首次實現了原生音頻生成，結合同期升級的 Music AI Sandbox ，無論是腳步聲、環境風聲還是背景配樂，都能與畫面動作完美同步，徹底終結了 AI 視頻的「默片時代」。
10 月的更新則進一步推高了行業天花板。 Veo 3.1 版本不僅大幅提升了光影變化與物體碰撞的物理一致性，還與全新創意工具 Flow 深度整合。更重要的是，它強化了「首尾幀控制」功能，允許創作者精準指定視頻的起點與終點，由 AI 補全中間過程，極大地增強了敘事的可控性。

相關鏈接：https://developers.googleblog.com/introducing-veo-3-1-and-new-creative-capabilities-in-the-gemini-api/
在圖像生成領域，隨著 5 月 Imagen 4 的奠基， Nano Banana 在今年大放異彩，其在匿名測試時就因表現優異而備受關注。 8 月，作為圖像生成的重大升級， Nano Banana 以極高的指令遵循能力著稱。它解決了「文字生成圖片」中細節丟失的問題。
而 11 月發布的 Nano Banana Pro 則將體驗推向了新高度。作為系列的旗艦版本，它首次引入了「深度思考」模式，在繪圖前先進行邏輯推理。這使得它不僅能精準還原極其復雜的 Prompt 構圖，更實現了高保真的文字渲染能力，無論是海報設計還是圖表繪制都達到了專業級水準。

「柏林」一詞融入了城市街區的建筑設計中，橫跨多棟建筑。
相關鏈接：https://blog.google/technology/ai/nano-banana-pro/
此外， Google Labs 在今年也涌現出眾多突破性實驗：從將設計瞬間轉化為代碼的 Stitch ，到開發者的異步協作伙伴 Jules ，再到 3D 視頻通信平臺 Google Beam ， AI 正在從單純的媒體生成工具，進化為重塑工作流的生產力核心。
從蛋白質到奧數金牌
AI 當起「全能科研隊友」
2025 年，谷歌在生命科學、醫療健康及數學邏輯等領域取得了里程碑式突破，不僅深化了人類對生物遺傳的理解，更在頂級智力競賽中證明了 AI 具備與人類頂尖水平相當的抽象推理能力。
首先來看生命科學領域。上個月， AlphaFold 迎來五周年紀念。在解決蛋白質結構預測難題五年后，該系統已為超過 2 億個蛋白質預測了結構，并助力全球 300 多萬名研究人員加速科研。這一成就通過開放數據庫徹底改變了結構生物學，并因其對生命科學的深遠貢獻榮獲了 2024 年諾貝爾化學獎。

此外，谷歌還發布了基因組理解模型 AlphaGenome ，這是一個能夠同時處理多達 1 兆堿基對的高分辨率 DNA 序列模型。它通過統一分析多種生物調控模式，幫助科學家解讀 DNA 中曾經難以捉摸的非編碼區域，為探尋遺傳病因和開發新型療法提供了全方位的生物集成開發環境。
再來看醫療健康領域。谷歌研究院推出的 DeepSomatic 利用卷積神經網絡，在腫瘤序列中以極高精度識別癌癥相關的遺傳變異。該工具能夠處理來自主流測序平臺的數據，幫助臨床醫生更準確地鎖定驅動癌癥的特定變異，從而實現真正的精準醫療和個性化治療。
而在科學發現方面，谷歌發布了一款基于大模型的編程智能體 ——AlphaEvolve ，專門用于尋找和驗證理論計算機科學中的復雜組合結構。它在驗證過程上實現了 1 萬倍的加速，成功協助科研人員收緊了優化問題的界限，標志著 AI 正從數據處理者轉型為深度參與數學發現的科研合作者。
此外，谷歌還推出了基于 Gemini 2.0 構建的多智能體協作系統 ——AI co-scientist ，旨在模仿科學研究的邏輯流程。它能獨立生成研究假設、設計實驗方案并撰寫研究提案，在生物醫學等領域展現了顯著縮短發現周期的潛力，成為了科學家的虛擬實驗室助手。
在代碼、數學邏輯方面，谷歌也站穩了第一梯隊。進階版 Gemini 2.5 Deep Think 在 2025 年國際大學生程序設計競賽（ICPC）總決賽中達到金牌水平，在 12 道題目中解出了 10 道。第 66 屆國際數學奧林匹克（IMO）中， Gemini Deep Think 憑借 35 分的高分（總分 42 分）達到金牌表現，完美解決了 6 道難題中的 5 道。
算力宇宙：量子回聲算法登 Nature
新一代 TPU 叫板英偉達
前段時間，谷歌創始人謝爾蓋?布林在參加母校的一次活動時表示，這些年，谷歌有很多失誤，比如沒有第一時間重視 Transformer 。但他們也做對了很多事情，比如對「計算」的投入。
首先，在量子計算方面，他們的重大突破 ——Quantum Echoes（量子回聲）算法在 10 月份登上了「Nature」。它在量子處理器上實現了首次可驗證的量子優越性，能以比最快超級計算機快 13000 倍的速度解決特定問題，為藥物研發、材料科學等領域的實際應用打開了新窗口。

相關鏈接：https://quantumai.google/static/site-assets/downloads/quantum-computation-molecular-geometry-via-nuclear-spin-echoes.pdf
這一進展得益于谷歌在量子計算方向的多年投入。今年，谷歌量子硬件首席科學家 Michel Devoret 和前量子人工智能硬件負責人 John Martinis 還因在量子計算方面的奠基性工作與加州大學伯克利分校教授 John Clarke 共同獲得了諾貝爾物理學獎。至此，谷歌的諾獎得主已經增加到五位，在科技界非常罕見。
除了量子計算，谷歌今年在 TPU 方向的進展同樣令人矚目。今年 4 月，第七代 TPU——Ironwood 正式發布。它專為「推理時代」設計，每塊芯片內存帶寬提升至 7.2 TB/s ，單芯片顯存容量達到 192GB 。當每個 pod 擴展至 9216 塊芯片時，它可提供 42.5 exaflops 的 AI 算力，遠超目前全球最快的超級計算機 El Capitan 的 1.7 exaflops 。每塊 Ironwood 芯片的峰值計算能力可達 4614 TFLOPs 。
谷歌透露，這款芯片的部分架構由其自家的 AI 模型 AlphaChip 輔助優化，大幅縮短了研發周期并優化了布局。
和英偉達 GPU 相比，這款新的 TPU 擁有極致的能效比，在電力供應受限的數據中心里，谷歌能用同樣的電量跑出更多的 AI 算力。此外，谷歌不把 TPU 看作單一芯片，而是一個名為 Pod 的整體，在超大規模集群（萬卡級別）的布線復雜度和電力損耗上， TPU 更有優勢。（關于 GPU 和 TPU 的更多對比參見《谷歌 TPU 殺瘋了，產能暴漲 120%、性能 4 倍吊打，英偉達還坐得穩嗎？》）
目前，谷歌已計劃到 2027 年實現年產 500 萬顆 TPU 的目標。目前，像 Anthropic 這樣的 AI 巨頭已經預訂了超過 100 萬顆 TPU 算力，這顯示出谷歌正通過「自研芯片 + 云服務」的閉環，在 AI 硬件市場有力地挑戰英偉達的統治地位。
Gemini Robotics
把「大模型 + 機器人」做到極致
在這波具身智能發展浪潮中，谷歌一直起到技術引領作用，通過一系列研究把「大模型 + 機器人」這件事做成了體系化、可迭代、且不斷刷新行業上限。
前兩年，他們通過 RT-1 和 RT-2 (Robotic Transformer) 率先證明了：大語言模型（LLM）的 Transformer 架構可以直接用于輸出機器人動作。
2025 年，他們進一步將 VLA 模型推向極致。 3 月份，他們推出了 Gemini Robotics ，通過將視覺、語言和動作三種模態與物理控制系統深度融合，首次實現了「感知 - 決策 - 動作」的全閉環操作，能夠直接根據視覺輸入和語言指令生成相應的機械臂軌跡，無需像傳統機器人那樣進行繁瑣的分步規劃。
9 月份， Gemini Robotics 1.5 問世，初步具備了以類似人類思考方式進行規劃行動的能力。它通過兩個模型的合作來達成此目標：ER 模型負責高層推理和決策，生成詳細的行動方案；VLA 模型負責感知和具體執行，并在執行過程中進行細粒度的自我推理校正。這種架構旨在結合兩者優勢，使機器人既能深思熟慮又能動作精準。

此外，他們還成功把大模型「塞進」邊緣設備并開放生態。 2025 年 6 月發布的 Gemini Robotics On-Device ，首次讓低延遲的 VLA 模型完全離線運行在機械臂和人形機器人上。他們還配套放出了 Gemini Robotics SDK ，開發者 50～100 次演示就能微調出可遷移的新技能。
Genie 3 引爆世界模型
哈薩比斯寄予厚望
提到世界模型，谷歌的 Genie 3 是今年的絕對亮點，被視為世界模型的新高峰（參見《震撼，世界模型第一次超真實地模擬了真實世界：谷歌 Genie 3 昨晚搶了 OpenAI 風頭》。
這不只是因為 Genie 3 畫面更逼真，而是它第一次把實時交互、長期一致性和語言可控性合成在同一個生成式系統中：它以每秒 24 幀、720p 的邊生成邊交互方式，讓用戶無需任何預制 3D 資產就能像玩游戲一樣實時探索，而且它具備長達幾分鐘的空間記憶，使世界在轉身離開后依然保持穩定連續。

正因如此， Genie 3 不再只是「可看的視頻模型」，而有望成為一個能支撐智能體長期試錯與規劃的訓練環境、一個把內容創作從搭場景降維到寫一句話的生產工具，以及一個可低成本復現極端情境的科學模擬沙盒，為通往通用智能提供了一條可交互、可長期演化的模擬路徑。
最近，哈薩比斯在采訪中說，除了 AI 之外，世界模型和模擬可能是他最長久的熱情所在。他認為，語言模型已經意外地學會了大量關于世界的知識，但真正的世界理解 —— 尤其是空間動態、物理因果和需要親身體驗的感知能力 —— 很難僅靠語言獲得，必須通過世界模型與模擬來補足。
世界模型本質上是一種「直覺物理學」，能理解事物如何運作、移動與相互作用，而生成逼真的世界正是這種理解的證明。像 Genie、Veo 這樣的交互式視頻與世界模型，是邁向通用智能、機器人和現實中通用助手的關鍵一步，最終也可能回到他最初熱愛的游戲與模擬，創造真正意義上的「終極游戲」。
挑戰天氣、疾病、教育
谷歌要改造世界
技術終究是為人服務的，在這方面，谷歌也披露了一些進展。
氣候方面，他們的洪水預警系統已經覆蓋 150 個國家、20 多億人口了。他們新出的天氣預報模型 WeatherNext 2 ，速度是以前的 8 倍，最精細能做到按小時預測。

項目鏈接：https://deepmind.google/science/weathernext/
醫療方面，他們在通用模型的基礎上打造了一些垂類模型，比如基于 Gemma 開源模型系列的、用于單細胞分析的 270 億參數基礎模型 Cell2Sentence-Scale 27B（C2S-Scale），該模型可以幫助發現新的潛在癌癥治療途徑。

項目鏈接：https://blog.google/technology/ai/google-gemma-ai-cancer-therapy-discovery/
教育方面，谷歌也嘗試了一些創新，包括：
在 Gemini AI 里推出了「Guided Learning」功能，它不像普通 AI 只給出答案，而是通過提問、步驟講解、圖片、視頻和測驗等方式，幫助用戶深入理解知識。基于 Gemini 打造了一系列經過微調、融入學習科學原理的生成式 AI 模型 ——LearnLM 。它在設計時參考了教育研究（如認知負荷管理、個性化反饋等），目的是讓 AI 更像導師而不是只給答案。把強大的 Gemini 翻譯能力帶到了谷歌翻譯和 Search 的翻譯功能中，讓文本翻譯更自然、更能理解語境（比如習語、俚語等），提高準確性，同時推出了基于 Gemini 的實時語音對話翻譯（Live translate），可通過耳機聽見更加自然流暢的即時翻譯。結語
縱觀 2025 年，谷歌展現出的并非單一技術的突進，而是一種強大的「系統性工程能力」。在算力層有 TPU 集群與量子回聲算法，在模型層有 Gemini 的邏輯進化，在應用層有諾獎級的科研產出。
這一年，谷歌顯然走出了「創新者的窘境」，不再糾結于先發優勢的喪失，而是利用其龐大的全棧生態完成了補課與追趕。在 AI 競爭從「在大模型上跑分」轉向「在產業鏈中落地」的下半場，這種從底層芯片到上層應用沒有任何短板的布局，或許才是科技巨頭最核心的競爭力。
參考鏈接：https://blog.google/technology/ai/2025-research-breakthroughs/#computing
文中視頻鏈接：https://mp.weixin.qq.com/s/aY9mWltD3zrI7FpG74At7Q

推薦閱讀

上一篇：消息稱蘋果基礎模型團隊超半數員工來自谷歌大部分在近2到4年加入

下一篇：機器人統一神經系統面世，實現蛇般思考，讓避障決策如同神經反射