Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!

Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!

文章圖片

Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!

文章圖片

Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!

文章圖片

Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!

文章圖片

Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!

文章圖片

Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!

文章圖片

Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!

文章圖片

Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!

文章圖片

Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!

文章圖片

編輯:元宇 好困
【新智元導讀】Google憑借Gemini 3、自研芯片、強大數據與研究團隊 , 正在重新超越OpenAI , 并帶動市占與用戶活躍度快速提升 。 在Google與OpenAI的雙雄之爭中 , 辛頓押谷歌會贏 。


「我猜 , 谷歌一定會贏」!
剛剛 , 辛頓發話:
Google已經開始超越OpenAI了 。



「AI教父」辛頓(Geoffrey Hinton)
超越就算了 , 他還說了一句更讓OpenAI扎心的話:
我覺得更讓人意外的是 , Google居然花了這么久才超越OpenAI 。


3年前 , ChatGPT的發布讓Google內部拉響了「紅色警報」 。
如今 , 拉響警報的變成了OpenAI 。
Google剛發布的Gemini 3版本獲得業內廣泛認可 , 有業內人士認為其表現已經超過OpenAI的GPT-5 。
Nano Banana Pro圖像模型也非常受歡迎 。
除了這些模型和產品之外 , 在辛頓看來 , 自研芯片也是Google的一個非常大的優勢 。
此外 , 辛頓還提到Google擁有很多非常優秀的研究人員 , 以及大量數據和龐大的數據中心 。
這些綜合優勢 , 讓辛頓認為Google會超越OpenAI并贏得最終勝利 。
從市場反應來看 , Gemini 3、Nano Banana Pro等模型的發布 , AI與現有搜索產品的整合 , 以及TPU與Meta達成價值十億美元的訂單 , 這些綜合優勢推動了谷歌母公司市值逼近4萬億美元大關 。
Hinton在Google Brain任職期間幫助推動了早期的AI研究 。
他提到 , Google曾長期引領AI , 但后來變得有所顧慮 。
Google發明了Transformer , 也比其他公司更早擁有自己的大型聊天機器人 。



辛頓表示 , 當微軟2016年發布的「Tay」因發表極具種族歧視的推文而迅速下線后 , Google開始變得格外謹慎 。
Google一直有很好的品牌聲譽 , 他們擔心類似的事情如果發生會把名聲毀了 。
此前 , Google CEO Sundar Pichai也曾表示 , 公司之所以沒有更早推出聊天機器人 , 是因為當時的產品成熟度還不夠 。
以往 , Google也曾經歷一些不太順利的產品發布 。
就在去年 , Google因用戶抱怨其AI圖像生成器產出的部分歷史人物膚色錯誤、顯得過度政治正確 , 而不得不中止該功能 。
其最初的AI搜索摘要 , 也曾給出荒唐建議 , 例如為了防止披薩上的芝士掉下來 , 可以在披薩上抹膠水 。



Gemini 3 Pro視覺推理封神


在Google的官方介紹中 , 將Gemini 3 Pro稱為「我們迄今為止最強大的多模態模型」 。

Google在介紹Gemini 3 Pro時 , 提到了一個重要的改變:
從「看見」 , 邁向了「理解」 。


Gemini 3 Pro在文檔、空間、屏幕和視頻理解方面都實現了驚人的表現 , 實現了從簡單識別邁向真正視覺與空間推理的跨代提升 。
Gemini 3 Pro在MMMU Pro和Video MMMU等復雜視覺推理基準上刷新紀錄 , 并在文檔、空間、界面以及長視頻理解等特定任務的測試中取得卓越成績 。

文檔理解
【Hinton最新預言刷屏:谷歌必贏,而且「早該贏了」!】

現實世界的文檔往往混亂、缺乏結構、難以解析 , 通常包含交錯的圖像、難辨認的手寫字、嵌套表格、復雜數學符號和非線性布局 。
Gemini 3 Pro在文檔處理能力上實現重大突破 , 從精準OCR到復雜視覺推理 , 都有顯著提升 。
它不僅看懂「是什么」 , 還能看懂「為什么」和「怎么關聯」 。
谷歌的一個核心能力叫「反渲染」(derendering):能將文檔畫面還原為結構化代碼(HTML、LaTeX、Markdown) 。
例如 , 它能把18世紀商人日志轉換成復雜表格 , 也能將帶有數學標注的圖像精準恢復為LaTeX 。

18世紀奧爾巴尼商人手冊中的手寫復雜表格
要真正理解一份文檔 , 模型需要準確識別文本、表格、數學公式、圖形和圖表 , 無論存在噪點還是格式混亂 。
除了智能感知 , 還要具備高級推理能力 。
Gemini 3能在長文檔中執行跨表格與圖表的多步復雜推理 。
在CharXiv基準中 , 它甚至以80.5%的成績超過了人類基線 。
舉例來說 , 用戶分析美國人口普查局62頁的《Income in the United States: 2022》報告時提出以下提示詞:
「比較2021–2022年貨幣收入與稅后收入的基尼指數變化百分比;并解釋是什么導致了稅后收入指標的偏離 。 另外 , 就貨幣收入而言 , 最低收入五分位的份額是上升還是下降?」
下方圖片展示了模型的逐步推理 。


空間理解


空間理解 , 是讓模型真正開始理解「物理世界」 。
Gemini 3 Pro可結合其推理能力更好地理解物理世界 。
其中一項關鍵能力是指向坐標 , 即通過輸出像素級坐標 , 模型可精確指向圖像中的某個位置 。
比如 , 可以估計人體姿態或分析動作軌跡 。
多個二維點串聯起來 , 就能執行較復雜任務 , 這是2D圖像邁向「世界模型」的關鍵一步 。
此外 , 還有開放詞匯指代 , 即模型能用開放詞匯識別物體及其意圖 。
例如在機器人領域 , 用戶說桌子很亂 , 幫我設計一個垃圾分類的整理步驟 。
模型不僅可以看到「物體」 , 還知道什么是垃圾 , 哪些要分類 , 應該如何整理它們 。
這一能力也延伸至AR/XR設備 , 用戶可請求AI助手「根據用戶手冊指出螺絲的位置 。 」






視頻理解


視頻是最復雜的數據形式:信息密集、變化快速、多模態且背景豐富 。 Gemini 3 Pro在視頻理解上邁出巨大一步 。
其中一個核心能力是高幀率理解 , 經優化后 , 模型在高于1 FPS的取樣下能更好地理解物體的快速運動 。
例如以10 FPS處理視頻 , Gemini 3 Pro可以捕捉每一次揮桿動作和重心轉移 , 從而支持深入的運動機理分析 。
此外 , 「思考模式」下的視頻推理 , 能夠讓模型跟蹤復雜的因果關系 。
不僅能「看到發生了什么」 , 還能理解「為什么發生」 。
甚至能把長視頻總結成可執行的應用程序 。
視頻不再是內容 , 而是知識源 。

  • 文檔理解 , 讓AI不僅可以識別字 , 更能理解內容;
  • 空間理解 , 讓AI可以理解三維世界;
  • 屏幕理解 , 讓AI可以看懂手機電腦屏幕正在發生什么;
  • 視頻理解 , 讓AI看懂視頻里的動作、原因和邏輯 。
Gemini 3 Pro讓AI第一次像一個「真正能看懂世界的人」一樣工作 。
如果說GPT-4開啟了「語言智能」時代 , 那么Gemini 3 Pro正在開啟一個視覺與行動智能時代 。
AI不再只會說話 , 而是開始理解世界 。



ChatGPT增速放緩 , Gemini快速追趕


在互聯網和AI行業 , 同樣遵循「飛輪效應」的經典模型 , 而用戶始終居于「飛輪效應」的核心位置 。
谷歌正是靠著這個原則 , 才筑起了搜索帝國 。
每一次搜索、每一次點擊 , 都會反哺它的反饋循環:用戶行為改進排序系統 , 排序系統讓結果更好 , 結果更好又吸引更多用戶 。
時間一長 , 飛輪形成的正向循環就形成了難以攻破的護城河 。
根據市場情報公司Sensor Tower的最新數據 , ChatGPT的增長勢頭正在趨緩 。
盡管它仍穩居行業第一 , 在移動端全球下載量中占50% , 在全球月活用戶中占55% , 但Gemini正在快速追趕 , 在下載增速、月活增速以及用戶使用時長增速方面全面超越ChatGPT 。
從趨勢上看 , 在用戶數量和活躍度等方面 , Gemini正在縮小與ChatGPT的差距 。
截至2025年11月 , ChatGPT的全球月活同比增長180% , 而Gemini同比增長170% 。

新數據顯示 , ChatGPT的月活在8月到11月之間僅增長約6% , 達到約8.1億 。
Sensor Tower表示 , 這可能意味著ChatGPT正逐漸接近市場飽和 。
相比之下 , Gemini的全球月活在同期躍升約30% , 主要受其新圖像生成模型Nano Banana推出后帶來的用戶激增影響 。
報告還指出 , 在美國Android用戶中 , 通過系統內置Gemini使用服務的人數 , 是使用獨立Gemini應用的兩倍 。
這可能讓Google在全球市場形成優勢 , 因為Android占據主導地位 , 意味著Gemini不再受限于移動App或網頁端使用 。
在與ChatGPT、Copilot、Claude、Perplexity和Grok等應用的對比中 , Gemini在整個市場的月活份額也在提升 。
該機構估算 , 過去七個月(5月至11月) , Gemini的全球月活市占率提升了3個百分點 。
相比之下 , ChatGPT的全球月活市占率在過去四個月(8至11月)下降了3個百分點 。
來自Perplexity和Claude等競品的壓力也愈發明顯 。

這兩款產品在2025年均迎來三位數增長:Perplexity同比上漲370% , Claude同比上漲190% 。
ChatGPT截至11月的全球下載量同比增長85% , 但仍落后于AI應用整體110%的平均增長速度 。
其中 , Perplexity與Gemini的下載量增速最高 , 分別達到215%和190%的同比增長 。
此外 , Sensor Tower表示 , Gemini用戶的日均使用時長在過去幾個月翻倍增長 。
截至11月 , Gemini用戶日均使用時長達到11分鐘 , 比3月增長120% , 很可能是受9月上線的圖像生成模型Nano Banana的帶動 。
同期ChatGPT用戶的日均使用時長僅增長6% , 且與7月相比 , 11月的使用時長下降了10% 。
雖然目前的數據表明Google正在逼近市場領頭羊 , 但其近期的大部分增長主要來自Nano Banana的成功 。



OpenAI還有勝算嗎?


龐大的用戶基數 , 以及對用戶心智的占領 , 一直是OpenAI強大的護城河 , 也是它領先其他競爭對手的重要資本 。
因此 , OpenAI能否在與谷歌的競爭中取勝 , 一個重要的指標就是看能否守住用戶基數上的優勢 。
前段時間 , OpenAI把攤子鋪得有點太大 , 勢必會放緩在模型產品上的迭代速度 。
當面對Gemini 3、Claude Opus 4.5等模型在benchmark(基準測試)中突出表現時 , 必然會造成OpenAI用戶的流失 。
用戶在選擇大模型時 , 更多是看模型的性能和體驗 , 而不是考慮用戶忠誠度 。
前段時間 , Salesforce CEO馬克·貝尼奧夫曾表示 , 在上手了Gemini 3兩小時后 , 立刻就拋棄了用了近三年的ChatGPT 。

這才是真正讓奧特曼擔心的地方 。
就在前幾天 , 奧特曼在致員工的備忘錄中發出「紅色警報」 , 稱要把精力拉回到提升ChatGPT上 , 其他優先級不高的項目暫時往后放 。
現在 , 每周有接近十億的人在使用ChatGPT , 龐大的用戶規模使得OpenAI擁有了一個前所未有的窗口 , 去洞察人類的意圖、好奇心和決策方式 。
每個提示詞、每段對話 , 都能被喂回模型訓練、評估和強化學習 , 進一步強化這個可能是全球最強的AI反饋循環 。
而奧特曼的「紅色警報」核心 , 就是要保護這個優勢 。
如果ChatGPT變得更好用 , 人們用它的頻率就會更高 , 使用越多循環越強 , 循環越強產品又會變得更好——一個不斷自我加速的飛輪效應 。
這也是OpenAI抵御谷歌進攻的強大堡壘 。
如今 , Gemini 3已經吸引了一波用戶 , OpenAI強大的堡壘已經有了一些松動的跡象 。
在這個節骨眼上 , 如果ChatGPT的質量有波動 , 或者界面變得雜亂 , 用戶跳去谷歌就更容易了 。
此前 , 就不斷有用戶對OpenAI在其產品中推送商品信息的行為表示反感 。

因此 , 就在外部緊盯OpenAI財務狀況的時候 , 奧特曼仍然決定先穩定自己的用戶飛輪 , 把上線廣告和賺錢的事情先放一放 。
目前 , OpenAI把希望押在新模型的發布上 , 以推動ChatGPT再次加速增長 。
但AI的投入成本極高 , OpenAI已經承諾要投入數千億美元來建設基礎設施 , 把ChatGPT推向真正的全球規模 。
因此 , 商業化的事情也不能一直拖著 。
先通過聚焦ChatGPT穩住用戶的基本盤 , 然后再探索廣告商業化機會 , 正是奧特曼在強敵壓境之下的重要考量 。
如今 , 相比較OpenAI , Google在模型上已經趕上 , 在芯片、產品矩陣、商業化能力等方面不斷鞏固優勢 。
奧特曼是否能有機會讓Google再次拉響「紅色警報」 , 可能要看新模型「Garlic」推出后的市場反應了 。
參考資料:
https://www.businessinsider.com/ai-godfather-geoffrey-hinton-google-overtaking-openai-2025-12
https://blog.google/technology/developers/gemini-3-pro-vision/

    推薦閱讀