
文章圖片

文章圖片
近期 , 一則“懸而未決”的競購在AI圈引發轟動 。
靠AI搜索成為行業獨角獸的Perplexity稱要以345億美元的價格收購谷歌的Chrome瀏覽器 , 這一報價幾乎是Perplexity自身估值(180億美元)的兩倍 。 想買Chrome的還不止Perplexity , 另一家AI明星企業OpenAI , 此前也透露出了收購意愿 。 不過 , 谷歌方面暫時沒有接受任何報價 。
看到這個新聞 , 很多人不由得發出疑問:瀏覽器 , 這個“老掉牙”的互聯網產品 , 怎么又重新“性感”起來了?
不止國外 , 國內互聯網大廠近一年來也都圍繞瀏覽器做文章 。 騰訊、阿里、360 , 分別押寶QQ瀏覽器、夸克瀏覽器、360AI瀏覽器 , 想要打造“AI時代的超級入口” 。
有必要討論:當AI遇上瀏覽器 , 會發生什么化學反應?AI瀏覽器 , 為什么能成為大廠和創業公司在AI時代的戰略重心?這場爭奪賽 , 誰最有可能占得先機?
AI瀏覽器的兩大流派:界面、功能各不相同什么是AI瀏覽器?
可以理解為將AI融入到傳統瀏覽器中 , 具備智能搜索與問答、內容理解與生成摘要、自動化任務執行、多模態交互體驗、個性化推薦等功能 , 實現從“工具”到“智能”的轉變 。
很多從業者認為 , AI瀏覽器和Agent一樣 , 都屬于大勢所趨 , 但此刻大家圍繞AI瀏覽器的謎團也有很多 。
目前各家公司在AI瀏覽器的技術路線與產品形態上有著明顯區別 , 究竟何種形態才能稱之為AI瀏覽器?它和Chatbot、Agent在功能和技術上又有何區別?
先看競爭比較激烈的國外市場 。
谷歌和微軟這兩大科技巨頭均推出了“AI瀏覽器” , 前者讓Chrome瀏覽器直接集成了AI能力 , 從而對用戶搜索內容進行總結提煉 。 后者則在原有Edge瀏覽器的基礎上推出了Copilot模式 , 啟用該模式后 , Edge瀏覽器的新標簽頁會變成一個簡潔的輸入框 , 用戶可以直接和AI對話 。
Edge中開啟Copilot模式
但與傳統版本相比 , 兩家AI瀏覽器的整體界面形態變化不大 。
從事Agent應用算法方向研究的資深人士趙江杰表示 , 谷歌和微軟均采用的是集成技術路線打造AI瀏覽器 , 即把AI作為獨立模塊融入到傳統瀏覽器架構中 , 可以簡單理解為 , 在管理網頁的基礎上 , 加上了AI能力和Chatbot式交互 。
另一種為AI原生路線 , 多為AI初創公司采用 。
比如Perplexity的Comet、TheBrowserCompany的Dia瀏覽器以及FellouAI的同名瀏覽器 , “這些產品在開發時便基于AI原生架構打造 , 和集成模式不同 , 它是在Chatbot式交互和AI能力的基礎上 , 加入網頁管理功能 。 界面設計大多采用對話框形式 , 凸顯了AI交互的核心地位 。 ”趙江杰表示 。
FellouAI頁面
再看國內 , 目前公開宣布研發AI瀏覽器的主要為互聯網大廠 , “AI六小虎”為代表的大模型初創公司尚未公布相關動作 , 趙江杰透露 , 除夸克外 , 國內大廠的AI瀏覽器基本都采用的是集成模式 。
除了界面存在差異 , 各家AI瀏覽器的功能側重點也不太一樣 , 區別在于智能化水平 。
目前大多數AI瀏覽器可以理解為非自主型 , 較傳統瀏覽器相比 , AI功能體現在能完成網頁總結、生成框架圖、推薦相似網頁、網頁翻譯、文字續寫、語音助手 。
比如360AI瀏覽器比較突出的功能有總結概括長視頻內容 , 快速梳理出重點概念并生成腦圖 。 阿里的夸克瀏覽器支持在文字之外制作PPT、生成圖片等多模態能力 。
總體來看 , 國外的Chrome以及國內絕大多數的AI瀏覽器 , 基本都以上述信息交互與內容生成功能為主 。
另一類偏自主型AI瀏覽器 , 能自主完成多網頁讀取與分析、自主操作復雜任務 , 以及預測用戶的個性化需求 。
比如國外的Comet、Dia可跨網站執行多步任務操作 , FellouAI更是號稱“全球首個行動型瀏覽器” , 用戶給出“在亞馬遜搜RTX4060顯卡 , 并按評分加購最高型號”的指令 , FellouAI會自動執行“登錄-篩選-比價-下單”整個過程 。
目前自主型AI瀏覽器是AI初創公司主打的功能方向 。
在趙江杰看來 , 自主型AI瀏覽器更加智能 , 不過他也強調 , 即便自主型AI瀏覽器看起來做到了智能化 , 但功能也比較基礎 , 目前成熟場景主要有三種:多標簽頁信息對比總結、自動搜索并回復社交媒體發帖、監控Gmail郵件反饋以及跨境電商自動報價等商用場景 。 總之 , 是輔助用戶處理一些重復性的工作 。
Agent帶飛瀏覽器在互聯網早期 , 因為具備搜索、社交、購物等多樣功能 , 瀏覽器曾是用戶上網的主要入口 。
2000年前后 , 微軟的IE瀏覽器(Internet Explorer , 后被Edge取代)憑借Windows系統預裝壟斷市場 , 份額一度高達95% 。 到了移動互聯網時代 , 隨著蘋果硬件暢銷、谷歌安卓系統被廣泛使用 , 蘋果的Safari瀏覽器和谷歌的Chrome瀏覽器不斷蠶食IE瀏覽器的地盤 。
根據市場調查機構 Statcounter 最新公布的數據 , 在全球所有平臺中 , Chrome、Safari、Edge的市場份額分別為:67.9%、16.2%、5.1% 。 在國內 , 除了三巨頭之外 , 360瀏覽器、QQ瀏覽器、UC瀏覽器也有一定的市場份額 。
然而 , 這些年瀏覽器們的日子并不好過 。 因為在移動時代 , 瀏覽器的入口地位被APP嚴重削弱 , 只有在訪問陌生網站、臨時查信息等場景下 , 瀏覽器還有一點存在感 。
到了AI時代 , 本來以為 , 被Chatbot接替了部分功能的瀏覽器 , 地位會更加岌岌可危 。 然而 , 隨著Agent的爆發 , 瀏覽器徹底“翻紅”了 。
石榴AI首席研究員、大模型從業者張恒認為 , 瀏覽器被重新重視 , 主要是因為它的Agent入口地位 。
據了解 , 大模型的產品形態由簡單到復雜可分為:Chatbot(對話機器人)、Copilot(智能助手)、單智能體和多智能體 , 后兩者被統稱為Agent 。 如今以ChatGPT為代表的Chatbot類產品 , 弊端越來越明顯 , 比如:用戶能否提出明確指令 , 直接影響回復的準確度與完成度 , 同時Chatbot自身缺乏長期記憶與連續性 , 這在一定程度上降低了大模型的智能水平 。
圖源 / pexels
相比之下 , Agent則像個有自主意識的智能助手 , 能幫用戶琢磨事、做計劃、動手干活、規劃行程、完成報告等等 , 且具有自主性和通用性 。
而這些功能的實現 , 繞不開瀏覽器 。
趙江杰表示 , 目前Agent的開發場景主要有兩種 , 一種是垂直領域 , 比如完成做視頻這種單一任務 , 只需生成視頻片段并做拼接 , 操作比較簡單 , 或者專門針對某一企業 , 只服務于公司內部系統 , 不用跨其他平臺 。
另一種則是toC場景 , 比如常見的網購、訂票 , 這種涉及可視化界面和跳轉到其他網站的功能 , 都得依靠瀏覽器 。
簡言之 , 瀏覽器是Agent的“舞臺” , 幫它在不同應用之間進行操作 , 從而完成訪問登錄網站、瀏覽電腦文件等復雜任務 。 “大模型像人的腦子 , Agent是手和腳 , 瀏覽器就是手腳和腦子一起干活兒的地方 , 在執行一項復雜指令時 , 需要大模型、Agent和瀏覽器三者協作完成 。 ”他表示 。
以購買一雙跑鞋為例 , 用戶下達這一指令后 , 大模型作為大腦接收、理解“買跑鞋”的任務 , Agent作為手腳行動將其拆解為“比價”“購買”等多個子任務執行 , 而其在操作時需要通過瀏覽器打開淘寶、京東這些網站 。
趙江杰認為 , Agent的關鍵在于高效完成任務并交付結果 , 而瀏覽器作為本地環境 , 天然具備訪問用戶本地數據和操作權限的能力 , 能直接讀取用戶的登錄狀態、已安裝的插件、本地存儲的數據等必要信息 , 從而顯著提升Agent完成任務的質量和準確性 。
而且 , 將瀏覽器作為Agent入口 , 用戶無需將賬號密碼等個人信息交給第三方AI工具 , 降低了泄露用戶隱私的風險 。
總之 , 如果Agent有未來 , 瀏覽器也會有未來 。
AI瀏覽器的喜和憂瀏覽器不僅是Agent入口 , 在整個AI生態中也占據著重要位置 。
張恒表示 , 瀏覽器減少了AI需要適配的終端類型 , 是AI應用的統一入口 , 比如 , 瀏覽器使Copilot的功能開發更聚焦 , 用戶無需在多個應用或設備間切換 , 提升了使用便捷性 。
意識到了瀏覽器對于AI產品的獨特價值 , Perplexity等AI獨角獸 , 不僅自研AI瀏覽器 , 還要花高價收購Chrome 。 綜合從業者的說法 , 競購的目的主要有兩點 。
一是搶市場份額 。
據第三方數據平臺Statcounter統計 , 截至2025年7月 , Chrome在全球瀏覽器市場的份額為67.9% , 擁有超過30億活躍用戶 , 可見其主導地位 。
在張恒看來 , 海外的瀏覽器三巨頭 , Edge主要適配Windows系統 , Safari依托蘋果設備的封閉生態 , 而Chrome憑借跨平臺兼容性、豐富的插件生態和與谷歌服務的深度整合 , 市占率最高 , 這就意味著AI初創公司只要掌握了Chrome、占有了Chrome產品 , 也就相當于擁有了大批用戶 , 比自己做瀏覽器從零積累要快得多 。
而且 , 做一個具有強兼容性和豐富生態的瀏覽器 , 復雜度等同于操作系統 。 “想要再自研一個類似于Chrome的瀏覽器難度巨大 , 市面上大多數瀏覽器都為Chrome(Chromium)套殼 。 ”趙江杰表示 。
圖源 / pexels
二是通過瀏覽器積累用戶數據 。
用戶在瀏覽器上的每一次搜索、每一次停留、每一個糾錯反饋 , 都是珍貴的數據信息 , “研發團隊不僅能及時根據用戶反饋優化AI模型 , 也可以用來改進AI產品 , 讓產品變得越來越‘懂’用戶 。 ”
不過 , 與傳統瀏覽器相比 , AI瀏覽器目前也有明顯弊端 , 一是會和Chatbot一樣出現“幻覺” , 二是生態尚未成熟 。
所謂“幻覺” , 就是AI會一本正經地胡說八道 , 編造出看似合理但根本不存在的信息 , 這主要是由于瀏覽器的信息生成、內容總結功能 , 都依賴大模型完成 。 換句話說 , 幻覺的根源是大模型 , AI瀏覽器自身無法降低幻覺 。
生態未成熟可以理解為配套問題 , “AI瀏覽器要理解網頁 , 要么靠截圖 , 要么靠解析DOM樹(網頁的結構化表示方法) , 但截圖會漏掉如下拉菜單這類隱藏元素 , 解析DOM樹又很耗費計算資源 。 而且現在的圖像識別技術 , 還沒法像人一樣順暢地操作復雜網頁 , 也會觸發驗證碼之類的安全驗證 , 這些都讓AI瀏覽器用起來不夠順暢 。 ”趙江杰表示 。
以上種種問題共同導致AI瀏覽器在實際應用中面臨效率低、可靠性差等挑戰 , 限制了其在復雜場景下的廣泛應用 。
在使用習慣上 , AI瀏覽器也面臨著不小的挑戰 。
一位從業者認為 , 傳統瀏覽器的核心操作邏輯是“用戶主動搜索+篩選” , 老用戶已經習慣了在地址欄輸網址或輸入關鍵詞、點鏈接跳轉 , 相比之下 , AI瀏覽器更像“主動服務” , 用戶能否適應這一轉變也不一定 , 這也是傳統搜索公司面對AI瀏覽器這塊“香餑餑”時格外謹慎、不敢貿然推出顛覆性的AI瀏覽器的原因 , 即便是推出了AI瀏覽器 , 也保留著傳統瀏覽器的操作界面 。
目前 , 從業者更傾向于構建“AI瀏覽器—Chatbot—Agent”的協同生態 , 實現各司其職的高效分工 , 三者的功能邊界與應用場景有所區分 , AI瀏覽器提供信息檢索和展示 , 方便用戶快速獲取信息;Chatbot一方面側重獲取信息的基礎功能 , 另一方面完成文本生成、知識問答等更細節性的任務 , 但不執行實際操作;Agent則是思考+操作 , 側重自動化辦公、數據分析等復雜任務 。
比如用戶想做一個假期帶娃出游計劃:可以用AI瀏覽器爬取OTA平臺、景區官方等平臺信息 , 篩選出適合帶娃的景點以及路線 , 然后自己做規劃;也可以讓Chatbot給出某地某項目適合多少歲的孩子玩等具體規劃 , 但自己買票;或者直接用Agent給出整體規劃并直達交付鏈條 , 即用戶接收確認景點門票的訂單鏈接 。
簡言之 , 同樣是做假期帶娃出游計劃 , AI瀏覽器負責給用戶整理信息包 , Chatbot給用戶提供詳細的建議和文案 , Agent不僅給建議 , 還幫用戶進行預約、下單 , 三者的核心差異在于“提供的服務深度”和“是否能自主操作” 。
不過 , 雖然瀏覽器已在AI時代展現出獨特價值 , 但仍然有很多問題等待解決 。
而眼下這場轟轟烈烈的“Chrome爭奪戰” , 最終的贏家 , 不僅會重寫瀏覽器的市場格局 , 更有可能主導AI時代的數據主權和技術標準 。
回到故事原點 , 美國司法部以反壟斷的理由 , 竭力想讓谷歌賣掉Chrome , 但“手握重器”的谷歌 , 一定知道Chrome的價值 , 也一定會盡力使Chrome免于分拆 。
那些想通過收購Chrome一飛沖天的AI公司 , 恐怕還得繼續眼饞 。
【瀏覽器,又“性感”了?】本文來自微信公眾號“定焦”(ID:dingjiaoone) , 作者:王璐 , 編輯:阿倫 , 36氪經授權發布 。
推薦閱讀
- 真我預熱“挑戰全球最大電池手機”,還有神秘新品
- 2025公認“接近完美”的拍照手機,512G大受歡迎,輕松用六年
- 阿里本地生活要做“拼好飯”?似乎并不現實
- “AI+跨境電商”大賽社會賽道賽果揭曉
- 蘋果服軟了?有國外網友發現,Apple TV+出現“隱藏折扣”
- 為什么總有私人號碼給你打電話,讓你免費升級話費套餐?
- vivo“雙機”被確認:一款已官宣,一款配置規格也已清晰!
- 3個月,降了2000元!
- 視頻產業的創意活力,被百度蒸汽機這顆“動力心臟”激活了
- 小米空調,打到格力家門口后,“華為空調”也要來了?
