OpenAI也來了,巨頭為何決戰AI瀏覽器?

OpenAI也來了,巨頭為何決戰AI瀏覽器?

文章圖片

OpenAI也來了,巨頭為何決戰AI瀏覽器?

文章圖片

OpenAI也來了,巨頭為何決戰AI瀏覽器?


定焦One(dingjiaoone)原創
作者 | 王璐
編輯 | 方展博
AI瀏覽器賽道再添一位重量級玩家——ChatGPT Atlas , 這是OpenAI推出的首款人工智能驅動的網頁瀏覽器 。
這也被外界認為OpenAI要向谷歌宣戰 , 挑戰Chrome一直以來的瀏覽器霸王地位 。 ChatGPT Atlas發布當天 , 谷歌母公司Alphabet股價應聲下挫 , 盤中最大跌幅接近5% , 足見市場對這一新品的敏感度 。
近一年來 , AI瀏覽器的戰略價值成為行業共識 , 從業者更是將其與智能代理(Agent)、搜索引擎放在一起 , 并稱為大語言模型(LLM)生態的三大核心基礎設施 , 而AI瀏覽器是連接用戶與AI能力的關鍵樞紐 。
巨大的戰略潛力催生了激烈的市場角逐 , 全球科技企業紛紛加速布局:
國內市場 , 騰訊和阿里分別升級QQ瀏覽器、夸克瀏覽器 , 360也有360AI瀏覽器 , 大廠們搶先完成AI化轉型;
國際市場 , 谷歌Chrome、微軟Edge兩大主流瀏覽器已深度集成AI功能;Perplexity的Comet、The Browser Company的Dia(已經被Atlassian收購)、Fellou AI的同名瀏覽器等獨角獸公司的產品也各具特色 。
如今ChatGPT Atlas加入戰局 , 更是標志著全球頭部玩家已全部集結 , AI瀏覽器行業的競爭進入白熱化階段 。
作為OpenAI的重磅產品 , ChatGPT Atlas具備哪些亮點功能?與國內外同類AI瀏覽器相比 , 核心競爭力又體現在哪里?這一市場究竟有什么吸引力 , 讓眾多玩家紛紛押注?
OpenAI的瀏覽器 , 亮點在哪里?作為OpenAI推出的首款人工智能驅動的網頁瀏覽器 , 其與傳統瀏覽器的最大區別在于 , 面對用戶拋出的問題 , 它會直接給出答案而非甩鏈接 。
但這一點并非其獨有優勢 , 幾乎市面上所有AI瀏覽器都能做到 , ChatGPT Atlas核心亮點在于 , 它圍繞用戶日常使用場景設計的四大功能 。
首先是“上下文側邊欄”功能 。
無論用戶是想總結一篇長文的核心觀點、分析網頁里的數據圖表 , 還是遇到專業術語想了解含義 , 不用手動復制粘貼內容 , 也不用在網頁和AI工具間來回切換 , 只要點擊ChatGPT Atlas里的「Ask ChatGPT」按鈕 , 輸入自身需求 , ChatGPT就能實時完成操作 。

在右側輸入需求 , ChatGPT Atlas便能給出實時回復
其次是AI協助寫作和編輯功能 。
該功能的操作也十分簡單 , 用戶只要選中文本并輸入要求 , ChatGPT可實時提供寫作建議、語法檢查和內容優化 。
這一功能覆蓋所有文本輸入場景 。 比如ChatGPT Atlas發現語法錯誤會自動標注 , 認為語句不通順會給出潤色建議 , 用戶寫郵件時不知道如何表達 , 它也會根據收件人和場景調整語氣 , 提升用戶的內容創作的效率 。
三是瀏覽器記憶功能 。
該功能可以記住用戶行為 , 比如自動保存用戶訪問過的網站上下文 , 從而基于瀏覽歷史給用戶提供個性化建議 。
以購物為例 , 用戶如果在雙11期間經常逛購物網站 , 它便會根據過往瀏覽的商品類型推薦合適的新品 。 用戶可以自主控制這些記憶 , 隨時可以查看、刪除 , 不用太過于擔心隱私泄露問題 。
四是Agent(智能體)模式 。
這是ChatGPT Atlas最受關注的功能 。
可以簡單理解為 , ChatGPT Atlas在獲得用戶授權后 , 可自主執行多步驟網絡操作 。
比如用戶輸入“幫我訂一張下周一去北京最便宜的機票”的指令 , Agent在接收并理解需求后 , 會生成執行計劃并展示關鍵步驟 , 由Agent在后臺自動完成搜索、填寫信息、提交訂單等操作 , 用戶無需手動操作 。 在整個任務執行的過程中 , 底部狀態欄會顯示進度 , 用戶可隨時點擊“接管”或“停止”按鈕干預任務 。

Agent模式下 , ChatGPT Atlas自主完成搜索加購等操作
此外 , 由于獲得用戶授權較多 , 在安全性上 , ChatGPT Atlas也增加了多重防護:禁止運行代碼、下載文件及安裝擴展 , 防范惡意程序入侵;訪問金融、支付類敏感網站時 , 自動暫停AI操作并需手動確認;退出登錄后 , 限制AI智能體權限 , 禁止訪問私人數據 。
不難發現 , ChatGPT Atlas的新功能不少 , 且不需要邀請碼 , 使用門檻很低 。 從發布當日起 , 全球ChatGPT用戶可在chatgpt.com/atlas下載ChatGPT Atlas的macOS版本 。
但需要注意的是 , 部分功能需要花錢 , ChatGPT的免費、Plus、Pro和Go用戶可免費使用基礎瀏覽功能 , 比如側邊欄、瀏覽器記憶 , 但“智能體模式”僅限Plus、Pro、Business用戶使用 。
ChatGPT Atlas , 還不夠聰明ChatGPT Atlas的推出 , 代表著AI瀏覽器行業進入了新的競爭階段 。 一名從業者告訴「定焦One」 , 市面上已有的AI瀏覽器產品 , 按照技術路線可分為兩大類:集成技術路線(谷歌、微軟以及國內絕大多數大廠)與AI原生路線(三大代表為:Comet、Dia、Fellou AI) , ChatGPT Atlas也屬于此類 。
兩種路線的技術原理和功能實現存在明顯區別:集成技術路線是在管理網頁的基礎上 , 加上了AI能力和Chatbot式交互 , 側重信息交互與內容生成功能;AI原生瀏覽器則在開發時就基于AI原生架構打造 , 是在Chatbot式交互和AI能力的基礎上 , 加入網頁管理功能 。
兩者最主要的區別在于智能化 , 后者更聰明 , 并集中體現在Agent能力上 。
比如Comet、Dia可跨網站執行多步任務操作 , Fellou AI更是號稱“全球首個行動型瀏覽器” , 例如 , 用戶給出“在亞馬遜搜RTX4060顯卡 , 并按評分加購最高型號”的指令 , Fellou AI會自動執行“登錄-篩選-比價-下單”整個過程 。

圖源 / pexels
與Comet、Dia等同類AI原生瀏覽器相比 , 最初外界看好ChatGPT Atlas的主要原因也在于智能化 , 認為其內置ChatGPT模型 , 能做到更聰明 。
可以簡單理解為 , Comet、Dia、Fellou AI代表了AI智能體的“任務自動化”能力 , 它們像是一位專業的、不知疲倦的助手 , 可以按照預設或生成的流程在多個網站間完成具體的操作 , 其核心價值是效率的提升和重復勞動的解放 。 而ChatGPT Atlas因為有了ChatGPT , 更像擁有一個強大的“大腦”(ChatGPT的推理和對話能力) , 從而與瀏覽器的“手腳”(執行操作)進行聯動 。
但目前ChatGPT Atlas所展示出的功能 , 與其他AI原生瀏覽器并無太大差異 。
比如在官方演示案例中 , 無論是工作場景中 , 用戶通過一個簡單的指令 , 讓AI代理自動完成了一項涉及理解、協調和跨工具數據遷移的任務 , 還是生活場景中 , 根據人數調整菜譜、生成清單到自動備好購物車的全流程 , ChatGPT Atlas的Agent模式依然聚焦于“效率提升” , 沒有展現出差異化 。
從業者在測試中還發現了更多問題 , 例如它僅支持單次調用單個已打開的網頁 , 而Dia已經能同時調用多個網頁標簽;ChatGPT Atlas執行任務的速度也較慢 , 簡單的在電商平臺下單任務 , 也需耗時少到幾分鐘多則十幾分鐘 , 遠慢于人工 。
綜合多輪實測結果 , 不止一位從業者認為 , ChatGPT Atlas的表現未達預期 。
“它(ChatGPT Atlas)最厲害的地方是生態 , 就像一個‘ChatGPT全家桶’ , 用戶在瀏覽器里能聊天、寫東西、讓它幫你做事 , 不用來回切換工具 。 相比之下 , Comet、Dia等AI瀏覽器 , 雖然功能也比較強 , 但生態體系相對孤立 , 體驗的流暢性就差了一些 。 ”一位從業者表示 。
從事Agent應用算法方向研究的資深從業者趙江杰對「定焦One」解釋 , ChatGPT Atlas的核心優勢 , 在于其依托OpenAI的基座模型、端到端Agent訓練能力 , 以及龐大的用戶生態 , 這三大能力是其他AI原生瀏覽器難以企及的 。
具體來說 , 其他產品的基座模型要么使用閉源模型 , 要么基于開源模型進行微調 , 一般會使用兩者混合的方式 , 閉源用來做高層規劃 , 開源微調適配低層特定場景需求 , 但無論采用哪種方式 , 都很難與OpenAI的技術實力抗衡;同時 , 它們在Agent訓練能力和用戶基數上 , 也與OpenAI存在明顯差距 。
不過 , 這些優勢需要通過長期使用才能充分顯現 。
趙江杰以記憶功能為例 , 用戶初次使用ChatGPT Atlas時 , 數據積累尚處于空白階段 , 此時產品自然無法深入洞察用戶的個性化喜好 , 但隨著用戶使用時長和頻次的增加 , ChatGPT Atlas將借助強大的推理能力 , 結合不斷沉淀的用戶歷史數據 , 逐步精準判斷用戶偏好 , 不僅能補全用戶未明確表達的隱性需求 , 還能準確理解用戶表述中的模糊指令 , 實現更貼合需求的服務 。
AI瀏覽器 , 下一代互聯網入口從目前的表現來看 , ChatGPT Atlas還談不上驚艷 , 但推出AI瀏覽器 , 是OpenAI和國內大廠不得不走的一步棋 。 多位從業者認為 , 這背后是對行業格局、生態構建與數據價值的深層考量 。
首先是戰略上 , OpenAI想要搶占AI時代的“第一入口” 。
一直以來 , 谷歌憑借Chrome瀏覽器 , 構建了覆蓋全球的流量入口與數字廣告霸權 。 第三方數據平臺Statcounter統計 , 截至2025年7月 , Chrome仍占據全球瀏覽器市場67.9%的絕對份額 , 活躍用戶超30億 。
這種主導地位使得谷歌牢牢掌控著用戶行為的“第一入口” , 以及隨之產生的海量數據 。
OpenAI推出Atlas , 根本目的是想改變這一游戲規則 。 用戶無需自己用關鍵詞搜索 , 而是讓AI直接給答案、完成任務 。 當用戶習慣了這種更省事的方式 , 自然會減少傳統搜索的使用次數 , 相當于從源頭上分流了谷歌的用戶 , 從而爭奪AI時代的“入口” 。
這一入口還可以讓OpenAI構建自己的AI生態和更多商業化機會 。
在互聯網早期 , 瀏覽器因聚合搜索、社交、購物等核心功能成為用戶上網的主要入口 , 而在AI時代 , 瀏覽器進化為融合大模型(大腦)、長期記憶(數據)與Agent(手腳)的載體 , 為模型及其工具的使用提供運行環境 , 特別是瀏覽器與Agent強相關 , Agent在不同應用之間完成訪問登錄網站、瀏覽電腦文件等任務時 , 都需要借助瀏覽器這一環境 。

圖源 / pexels
比如 , 在工作場景上 , 用戶在ChatGPT Atlas完成從信息獲取、分析、處理到輸出成果的全鏈條工作” , 在生活場景上 , ChatGPT Atlas把搜索-比價-下單全流程綁在一起 , 讓用戶不用再切換多個APP 。 這種由Agent自動化過程中對瀏覽器工具鏈、應用生態的深度集成使用 , 能創造出一種“全場景”下的生態閉環 。
趙江杰表示 , ChatGPT Atlas可以讓OpenAI在用戶訂閱、API調取等收費形式之外 , 找到更多商業化途徑 。
相比單一聊天工具(ChatGPT), 覆蓋用戶全場景行為的ChatGPT Atlas能獲取更完整的用戶行為數據(尤其是和消費、決策相關的軌跡) 。 這些數據能讓廣告推薦更精準、商業轉化的歸因更清晰 , 進而開辟廣告投放、商業分成、場景化付費等新的變現途徑 。
最后是數據反哺 。
用戶在瀏覽器中每一次搜索查詢、頁面停留、點擊決策乃至操作糾錯 , 背后都代表的是其真實意圖與偏好的高質量數據 , 這些實時的、連續的用戶數據 , 對于大模型監督微調和強化學習至關重要 。
ChatGPT Atlas的存在讓OpenAI可以在自有瀏覽器中直接捕獲這些數據 , 從而精準評估模型表現、發現問題并快速修復 。 不僅能優化ChatGPT Atlas這一產品 , 更能反哺GPT核心模型 , 形成一個“產品更好用-用戶和數據更多-模型更強”的循環 。
國內大廠紛紛布局AI瀏覽器的戰略目的 , 與OpenAI有相似之處 。 短期是處于“防守”考慮 , 目前ChatGPT等AI工具正改變著用戶的搜索習慣 , 越來越多用戶減少了對傳統瀏覽器搜索結果的依賴 , 大廠將自身的傳統瀏覽器升級 , 能保護自己現有的流量和業務基本盤 , 而長期來看 , 大廠也希望借助AI瀏覽器找到更多商業機會 。
AI瀏覽器 , 是一場持久戰 。
【OpenAI也來了,巨頭為何決戰AI瀏覽器?】*題圖來源于pexels 。

    推薦閱讀