Hinton最新預言刷屏：谷歌必贏，而且「早該贏了」！

2026-01-06 ai

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

編輯：元宇好困
【新智元導讀】Google憑借Gemini 3、自研芯片、強大數據與研究團隊，正在重新超越OpenAI ，并帶動市占與用戶活躍度快速提升。在Google與OpenAI的雙雄之爭中，辛頓押谷歌會贏。

「我猜，谷歌一定會贏」！
剛剛，辛頓發話：
Google已經開始超越OpenAI了。

「AI教父」辛頓（Geoffrey Hinton）
超越就算了，他還說了一句更讓OpenAI扎心的話：
我覺得更讓人意外的是， Google居然花了這么久才超越OpenAI 。

3年前， ChatGPT的發布讓Google內部拉響了「紅色警報」。
如今，拉響警報的變成了OpenAI 。
Google剛發布的Gemini 3版本獲得業內廣泛認可，有業內人士認為其表現已經超過OpenAI的GPT-5 。
Nano Banana Pro圖像模型也非常受歡迎。
除了這些模型和產品之外，在辛頓看來，自研芯片也是Google的一個非常大的優勢。
此外，辛頓還提到Google擁有很多非常優秀的研究人員，以及大量數據和龐大的數據中心。
這些綜合優勢，讓辛頓認為Google會超越OpenAI并贏得最終勝利。
從市場反應來看， Gemini 3、Nano Banana Pro等模型的發布， AI與現有搜索產品的整合，以及TPU與Meta達成價值十億美元的訂單，這些綜合優勢推動了谷歌母公司市值逼近4萬億美元大關。
Hinton在Google Brain任職期間幫助推動了早期的AI研究。
他提到， Google曾長期引領AI ，但后來變得有所顧慮。
Google發明了Transformer ，也比其他公司更早擁有自己的大型聊天機器人。

辛頓表示，當微軟2016年發布的「Tay」因發表極具種族歧視的推文而迅速下線后， Google開始變得格外謹慎。
Google一直有很好的品牌聲譽，他們擔心類似的事情如果發生會把名聲毀了。
此前， Google CEO Sundar Pichai也曾表示，公司之所以沒有更早推出聊天機器人，是因為當時的產品成熟度還不夠。
以往， Google也曾經歷一些不太順利的產品發布。
就在去年， Google因用戶抱怨其AI圖像生成器產出的部分歷史人物膚色錯誤、顯得過度政治正確，而不得不中止該功能。
其最初的AI搜索摘要，也曾給出荒唐建議，例如為了防止披薩上的芝士掉下來，可以在披薩上抹膠水。

Gemini 3 Pro視覺推理封神

在Google的官方介紹中，將Gemini 3 Pro稱為「我們迄今為止最強大的多模態模型」。

Google在介紹Gemini 3 Pro時，提到了一個重要的改變：
從「看見」，邁向了「理解」。

Gemini 3 Pro在文檔、空間、屏幕和視頻理解方面都實現了驚人的表現，實現了從簡單識別邁向真正視覺與空間推理的跨代提升。
Gemini 3 Pro在MMMU Pro和Video MMMU等復雜視覺推理基準上刷新紀錄，并在文檔、空間、界面以及長視頻理解等特定任務的測試中取得卓越成績。

文檔理解
【Hinton最新預言刷屏：谷歌必贏，而且「早該贏了」！】

現實世界的文檔往往混亂、缺乏結構、難以解析，通常包含交錯的圖像、難辨認的手寫字、嵌套表格、復雜數學符號和非線性布局。
Gemini 3 Pro在文檔處理能力上實現重大突破，從精準OCR到復雜視覺推理，都有顯著提升。
它不僅看懂「是什么」，還能看懂「為什么」和「怎么關聯」。
谷歌的一個核心能力叫「反渲染」（derendering）：能將文檔畫面還原為結構化代碼（HTML、LaTeX、Markdown）。
例如，它能把18世紀商人日志轉換成復雜表格，也能將帶有數學標注的圖像精準恢復為LaTeX 。

18世紀奧爾巴尼商人手冊中的手寫復雜表格
要真正理解一份文檔，模型需要準確識別文本、表格、數學公式、圖形和圖表，無論存在噪點還是格式混亂。
除了智能感知，還要具備高級推理能力。
Gemini 3能在長文檔中執行跨表格與圖表的多步復雜推理。
在CharXiv基準中，它甚至以80.5%的成績超過了人類基線。
舉例來說，用戶分析美國人口普查局62頁的《Income in the United States: 2022》報告時提出以下提示詞：
「比較2021–2022年貨幣收入與稅后收入的基尼指數變化百分比；并解釋是什么導致了稅后收入指標的偏離。另外，就貨幣收入而言，最低收入五分位的份額是上升還是下降？」
下方圖片展示了模型的逐步推理。

空間理解

空間理解，是讓模型真正開始理解「物理世界」。
Gemini 3 Pro可結合其推理能力更好地理解物理世界。
其中一項關鍵能力是指向坐標，即通過輸出像素級坐標，模型可精確指向圖像中的某個位置。
比如，可以估計人體姿態或分析動作軌跡。
多個二維點串聯起來，就能執行較復雜任務，這是2D圖像邁向「世界模型」的關鍵一步。
此外，還有開放詞匯指代，即模型能用開放詞匯識別物體及其意圖。
例如在機器人領域，用戶說桌子很亂，幫我設計一個垃圾分類的整理步驟。
模型不僅可以看到「物體」，還知道什么是垃圾，哪些要分類，應該如何整理它們。
這一能力也延伸至AR/XR設備，用戶可請求AI助手「根據用戶手冊指出螺絲的位置。」

視頻理解

視頻是最復雜的數據形式：信息密集、變化快速、多模態且背景豐富。 Gemini 3 Pro在視頻理解上邁出巨大一步。
其中一個核心能力是高幀率理解，經優化后，模型在高于1 FPS的取樣下能更好地理解物體的快速運動。
例如以10 FPS處理視頻， Gemini 3 Pro可以捕捉每一次揮桿動作和重心轉移，從而支持深入的運動機理分析。
此外，「思考模式」下的視頻推理，能夠讓模型跟蹤復雜的因果關系。
不僅能「看到發生了什么」，還能理解「為什么發生」。
甚至能把長視頻總結成可執行的應用程序。
視頻不再是內容，而是知識源。

文檔理解，讓AI不僅可以識別字，更能理解內容；
空間理解，讓AI可以理解三維世界；
屏幕理解，讓AI可以看懂手機電腦屏幕正在發生什么；
視頻理解，讓AI看懂視頻里的動作、原因和邏輯。

Gemini 3 Pro讓AI第一次像一個「真正能看懂世界的人」一樣工作。
如果說GPT-4開啟了「語言智能」時代，那么Gemini 3 Pro正在開啟一個視覺與行動智能時代。
AI不再只會說話，而是開始理解世界。

ChatGPT增速放緩， Gemini快速追趕

在互聯網和AI行業，同樣遵循「飛輪效應」的經典模型，而用戶始終居于「飛輪效應」的核心位置。
谷歌正是靠著這個原則，才筑起了搜索帝國。
每一次搜索、每一次點擊，都會反哺它的反饋循環：用戶行為改進排序系統，排序系統讓結果更好，結果更好又吸引更多用戶。
時間一長，飛輪形成的正向循環就形成了難以攻破的護城河。
根據市場情報公司Sensor Tower的最新數據， ChatGPT的增長勢頭正在趨緩。
盡管它仍穩居行業第一，在移動端全球下載量中占50% ，在全球月活用戶中占55% ，但Gemini正在快速追趕，在下載增速、月活增速以及用戶使用時長增速方面全面超越ChatGPT 。
從趨勢上看，在用戶數量和活躍度等方面， Gemini正在縮小與ChatGPT的差距。
截至2025年11月， ChatGPT的全球月活同比增長180% ，而Gemini同比增長170% 。

新數據顯示， ChatGPT的月活在8月到11月之間僅增長約6% ，達到約8.1億。
Sensor Tower表示，這可能意味著ChatGPT正逐漸接近市場飽和。
相比之下， Gemini的全球月活在同期躍升約30% ，主要受其新圖像生成模型Nano Banana推出后帶來的用戶激增影響。
報告還指出，在美國Android用戶中，通過系統內置Gemini使用服務的人數，是使用獨立Gemini應用的兩倍。
這可能讓Google在全球市場形成優勢，因為Android占據主導地位，意味著Gemini不再受限于移動App或網頁端使用。
在與ChatGPT、Copilot、Claude、Perplexity和Grok等應用的對比中， Gemini在整個市場的月活份額也在提升。
該機構估算，過去七個月（5月至11月）， Gemini的全球月活市占率提升了3個百分點。
相比之下， ChatGPT的全球月活市占率在過去四個月（8至11月）下降了3個百分點。
來自Perplexity和Claude等競品的壓力也愈發明顯。

這兩款產品在2025年均迎來三位數增長：Perplexity同比上漲370% ， Claude同比上漲190% 。
ChatGPT截至11月的全球下載量同比增長85% ，但仍落后于AI應用整體110%的平均增長速度。
其中， Perplexity與Gemini的下載量增速最高，分別達到215%和190%的同比增長。
此外， Sensor Tower表示， Gemini用戶的日均使用時長在過去幾個月翻倍增長。
截至11月， Gemini用戶日均使用時長達到11分鐘，比3月增長120% ，很可能是受9月上線的圖像生成模型Nano Banana的帶動。
同期ChatGPT用戶的日均使用時長僅增長6% ，且與7月相比， 11月的使用時長下降了10% 。
雖然目前的數據表明Google正在逼近市場領頭羊，但其近期的大部分增長主要來自Nano Banana的成功。

OpenAI還有勝算嗎？

龐大的用戶基數，以及對用戶心智的占領，一直是OpenAI強大的護城河，也是它領先其他競爭對手的重要資本。
因此， OpenAI能否在與谷歌的競爭中取勝，一個重要的指標就是看能否守住用戶基數上的優勢。
前段時間， OpenAI把攤子鋪得有點太大，勢必會放緩在模型產品上的迭代速度。
當面對Gemini 3、Claude Opus 4.5等模型在benchmark（基準測試）中突出表現時，必然會造成OpenAI用戶的流失。
用戶在選擇大模型時，更多是看模型的性能和體驗，而不是考慮用戶忠誠度。
前段時間， Salesforce CEO馬克·貝尼奧夫曾表示，在上手了Gemini 3兩小時后，立刻就拋棄了用了近三年的ChatGPT 。

這才是真正讓奧特曼擔心的地方。
就在前幾天，奧特曼在致員工的備忘錄中發出「紅色警報」，稱要把精力拉回到提升ChatGPT上，其他優先級不高的項目暫時往后放。
現在，每周有接近十億的人在使用ChatGPT ，龐大的用戶規模使得OpenAI擁有了一個前所未有的窗口，去洞察人類的意圖、好奇心和決策方式。
每個提示詞、每段對話，都能被喂回模型訓練、評估和強化學習，進一步強化這個可能是全球最強的AI反饋循環。
而奧特曼的「紅色警報」核心，就是要保護這個優勢。
如果ChatGPT變得更好用，人們用它的頻率就會更高，使用越多循環越強，循環越強產品又會變得更好——一個不斷自我加速的飛輪效應。
這也是OpenAI抵御谷歌進攻的強大堡壘。
如今， Gemini 3已經吸引了一波用戶， OpenAI強大的堡壘已經有了一些松動的跡象。
在這個節骨眼上，如果ChatGPT的質量有波動，或者界面變得雜亂，用戶跳去谷歌就更容易了。
此前，就不斷有用戶對OpenAI在其產品中推送商品信息的行為表示反感。

因此，就在外部緊盯OpenAI財務狀況的時候，奧特曼仍然決定先穩定自己的用戶飛輪，把上線廣告和賺錢的事情先放一放。
目前， OpenAI把希望押在新模型的發布上，以推動ChatGPT再次加速增長。
但AI的投入成本極高， OpenAI已經承諾要投入數千億美元來建設基礎設施，把ChatGPT推向真正的全球規模。
因此，商業化的事情也不能一直拖著。
先通過聚焦ChatGPT穩住用戶的基本盤，然后再探索廣告商業化機會，正是奧特曼在強敵壓境之下的重要考量。
如今，相比較OpenAI ， Google在模型上已經趕上，在芯片、產品矩陣、商業化能力等方面不斷鞏固優勢。
奧特曼是否能有機會讓Google再次拉響「紅色警報」，可能要看新模型「Garlic」推出后的市場反應了。
參考資料：
https://www.businessinsider.com/ai-godfather-geoffrey-hinton-google-overtaking-openai-2025-12
https://blog.google/technology/developers/gemini-3-pro-vision/

推薦閱讀

上一篇：12月又一款新機官宣：12月8日，正式開售

下一篇：iOS26.2 RC實測：流暢回歸、動畫更順、電池更耐看，但升級要分人