ChatGPT負責人深度復盤:我們做錯了什么?

ChatGPT負責人深度復盤:我們做錯了什么?

智東西
【ChatGPT負責人深度復盤:我們做錯了什么?】編譯 | 陳駿達
編輯 | Panken
智東西8月19日報道 , 近日 , OpenAI副總裁、ChatGPT負責人Nick Turley接受了科技媒體The Verge的40分鐘專訪 , 深度復盤GPT-5發布后面臨的用戶差評風波 , 解釋光速下線GPT-4o背后的考量 , 并總結出OpenAI在這一決策背后犯下的兩大誤判 。
2周前 , OpenAI上線了外界期待已久的GPT-5 , 并取代了原有的主力模型GPT-4o 。 這一決策掀起了聲勢浩大的用戶抗議——Reddit、X平臺上的用戶從回答質量、情感體驗等角度花式吐槽GPT-5 , 稱其“冷冰冰”、沒有“人味兒” , 也有網友認為其剝奪了用戶的選擇權 , 相關帖子獲得成千上萬的評論 。 作為回應 , OpenAI緊急重新上線了GPT-4o , 并承諾將實行提高模型選擇透明度、改進模型語氣等補救措施 。
對于這場風波 , Nick Turley回應道:“沒有繼續提供GPT-4o , 哪怕只是過渡階段 , 也是個失誤 。 ”其次 , OpenAI也低估了用戶對模型的感情 。 未來 , 他們會對模型下線提供更為清晰的時間表 , 至于GPT-4o , 如果沒有迫切理由要下線 , Nick Turley稱希望能一直保留它 。
這一風波也讓Nick Turley對ChatGPT的用戶群體有了更深的認知 , 他意識到 , “用戶群體其實非常兩極分化” 。 對大部分不泡Reddit、不刷推特的普通用戶來說 , 選擇模型本身是有較高的認知門檻的 。 用GPT-5取代GPT-4o這個決定的出發點是保持簡潔 , Nick Turley認為這對大多數人來說是正確的決定 。
但另一方面 , 少部分熟悉AI技術的重度用戶(Power User)有較強的定制化需求 , 包括模型選擇 。 OpenAI僅為200美元/月的Pro訂閱用戶保留了選擇權 , 但沒意識到在其他訂閱方案里 , 也有許多重度用戶 。 未來 , OpenAI會繼續保持簡潔 , 但為重度用戶保留完整模型切換選項 。
Nick Turley稱 , ChaGPT的產品哲學并非延長用戶使用時長 , 而是高效解決問題 , 這往往意味著減少用戶使用時長;用戶的情感依賴也不是OpenAI的目標 , 更像是“副作用” , 需要解決 。 他進一步補充道 , OpenAI沒動力讓用戶花更多時間在產品上 , “我們的商業模式很簡單:免費用 , 喜歡就訂閱 。 ”
在訪談中 , Nick Turley也分享了ChatGPT成功增長背后的三大驅動力:模型能力提升、科研+產品復合創新以及傳統的增長手段 , 三者比例基本一致 。 其中 , 僅僅是取消ChatGPT的登錄限制 , 就新增了不少使用量 。
ChatGPT為什么還是個聊天機器人的模樣?Nick Turley坦言 , 自己對這一問題也還十分困惑 , ChatGPT原本只是個臨時原型 , 用于收集反饋 , 其成功證明了自然語言交互的潛力 。 未來 , 自然語言交互仍會存在 , 但是否是聊天機器人的形式 , 仍有待驗證 。 OpenAI對產品形態有著更宏大的愿景 。
Nick Turley還在這一信息量滿滿的訪談中 , 分享了ChatGPT訂閱模式展現出的強大韌性 , 以及OpenAI在廣告、購物等領域的商業規劃 。 他也澄清了此前傳出OpenAI有意收購Chrome的消息 , 稱自己當時的表述被“嚴重斷章取義” 。
以下是Nick Turley接受The Verge采訪的完整編譯:

一、沒有繼續提供GPT-4o是失誤 , 未來這一模型非必要不下線主持人:我們錄制的時間正好是GPT-5發布后1周 , 我覺得這讓我們有很多可以聊的 。 我想先從發布本身和大家對下架GPT-4o的反應開始說 , 因為我覺得這很能說明人們是怎么使用AI的 , 以及他們對它的感受 。 這種反應讓你意外嗎?
Nick Turley:我現在還在消化這次發布的影響 , 這對我們來說確實是個大動作 。 我們現在的周活躍用戶規模已經7億了 , 在這個量級下 , 驚喜和意外幾乎是常態 , 因為用戶太多 , 用戶構成也太多元了 。 是的 , 我確實有點意外 。
第一 , 我覺得我們需要更加認真地思考 , 如何在這么大的用戶群體中做變更和管理 。 回頭看 , 沒有繼續提供GPT-4o , 哪怕只是過渡階段 , 也是個失誤 。 我們會修復這個問題 , 讓ChatGPT Plus用戶繼續能用GPT-4o 。
第二 , 我沒想到大家對模型的感情會這么強烈 。 不僅僅是對變化的不適應 , 而是真正對一個模型的“個性”產生了情感 。 我們其實剛剛上線了“選擇你自己的個性”功能 , 這是一個小步驟 。 但顯然GPT-4o身上有些特質仍待理解 , 我們也要確保GPT-5能解決這一問題 。
主持人:Sam Altman(OpenAI聯合創始人兼CEO)在發布后發推說 , 用戶的情感依賴問題是你們過去一年一直在追蹤的現象 , 但還沒有受到太多主流關注 。 我覺得現在可以說 , 這個問題已經獲得了注意 。
當你們決定用GPT-5完全替代GPT-4o , 而不是分階段推出時 , 這個決定背后的原因是什么?是成本考慮嗎?還是覺得用戶其實不是對某個模型有依賴 , 而是整體體驗更重要?
Nick Turley:這絕對不是成本問題 。 我們一直追求的目標其實是“簡潔” 。 對大部分普通用戶來說(而他們是大多數 , 他們不泡Reddit , 不刷推特) , 要自己判斷用哪個模型解決什么問題 , 是有很高的認知門檻的 。 我們反復聽到的反饋就是:他們希望產品自動幫他們做合適的選擇 。 他們想要的是一個產品 , 而不是一堆模型的集合 。
當然我們也考慮到重度用戶 。 在Pro計劃(200美元/月的訂閱)里 , 我們非常堅持保留了所有老模型 , 這一點沒變 。 但我們沒意識到在其他套餐里也有很多“重度用戶” 。 很快意識到后 , 我們就調整了 。 這其實就是OpenAI的風格:傾聽用戶 , 然后迅速迭代 。
用GPT-5取代GPT-4o這個決定的出發點是保持簡潔 , 我認為對大多數人來說這是正確的 。
我覺得macOS就是個好類比:它對大多數人來說很簡單 , 但如果你想深入折騰 , 也能去終端里調各種參數 。 我希望ChatGPT也能類似:默認簡單 , 但你也可以自定義 , 包括選擇自己喜歡的模型 。
主持人:這次的反饋會不會讓你們決定以后對模型設定一個明確的下線時間表?比如等GPT-6出來時 , GPT-5還會繼續存在多久 。 你們現在會考慮這個問題嗎?
Nick Turley:是的 , 這正是我們正在討論的 。 我個人覺得我們確實需要這樣做 。 我們的規模已經大到必須在重大變化時給用戶一些可預期性 。
我們在企業方案里已經有這樣的機制了 , API有明確的下線周期 , 所以提供這種可預測性 , 其實并不是一個重大的改變 , 而是把已有方案擴展到其他產品線上 。 這就是這次發布學到的一個很清晰的教訓 。
主持人:那GPT-4o會繼續存在多久?你們有沒有承諾一個具體時間?
Nick Turley:目前還沒有 。 我們想先搞清楚GPT-4o的獨特價值 , 如果沒有迫切理由要下線 , 我希望能一直保留它 。 未來如果真的要退役 , 我們會提前通知 , 這也是個教訓 。
但現在我更想先理解:人們是真的對“GPT-4o本身”有特殊感情 , 還是GPT-4o身上某些特質特別吸引他們 。 比如我聽到的“更溫暖的個性” 。 我們也會把這一點帶到GPT-5 。
理解這一問題后 , 會有很多不同的解決辦法 。 我們剛剛上線的“選擇個性”功能就是在做嘗試 。 我個人很喜歡一個叫“Robot”的個性 , 但很多人不喜歡 , 因為它的語氣更冷一些 。
解決方案會因我們收集的反饋而異 。 構建AI的獨特之處在于 , 上線后總能獲得海量新認知 。 基于這些發現 , 我們會制定最佳方案 。 但有一點可以保證:即便未來要停用4o版本 , 我們也會像處理API和企業版那樣 , 提前告知用戶具體時間和過渡方式 。

二、提高用戶使用時長有悖產品哲學 , 情感依賴現象是“副作用”主持人:你剛剛說到正在把GPT-4o的“溫暖”帶到GPT-5 , 這件事正在進行中嗎?
Nick Turley:對的 。 這其實是我們的常態 , 我們有一個“模型行為團隊” , 他們不斷迭代模型的個性和行為 。 我們還發布了“Spec” , 讓大家可以審查哪些是有意設計的、哪些是bug 。 未來幾周甚至數月內 , GPT-5的交互體驗會不斷演進 , 這種持續改進是我們一貫的做法 。
主持人:你已經提到Reddit不能代表大多數用戶 , 但上面的反應令人震撼 。 有人說:“一夜之間失去了唯一的朋友 , 像經歷了一場死亡”;”害怕和GPT-5交流 , 因為感覺像出軌了”;“失去了能共情的同事” 。
這種情感依賴程度是否超出了你們的預期?這種反應對公司內部有什么影響?你們是否沒想到人們會有這么深的情感依賴?
Nick Turley:正如Sam說的 , 我們一直在關注這種情況 , 也擔心人們過度依賴AI 。 但我確實沒想到大家會對某一個具體模型 , 而不是產品本身有這么強烈的情感 。 尤其是我們其實在GPT-5里改進了很多GPT-4o的問題 , 包括語氣和氛圍 。
Reddit的評論讓我意識到 , 用戶群體其實非常兩極分化 。 有些人瘋狂喜歡GPT-4o , 有些人強烈覺得GPT-5更好 。 大家對自己選擇的熱情真的讓我驚訝 。 這讓我重新調整了認知 。
我們最近發了一篇博客 , 里面我特別強調了我們優化ChatGPT的產品哲學:我們的目標不是讓用戶花更多時間待在產品里 , 而是幫助用戶解決長期問題、達成長期目標 , 這往往意味著在產品里花的時間要更少 。
當我看到有人說“這是我唯一的朋友”時 , 這并不是我們打造ChatGPT時想要的效果 。 這是個副作用 , 因此我們必須認真對待并深入研究 。
主持人:那你們怎么平衡你們的目標和用戶的使用方式之間的差異呢?
Nick Turley:當面對7億用戶時 , 必然會有這種情況 。 我們的目標可以很純粹——我們希望對用戶有幫助 , 哪怕有時要說他們不愛聽的話 , 但這一目標也并不一定完美 , 用戶的使用方式未必完全符合我們預期 。
所以我們在咨詢專家后進行了許多修改 , 特別是在敏感領域 。 比如這次我們和很多不同國家的心理健康專家交流 , 研究如何應對用戶過度使用產品、甚至已經影響身心健康的情況 。
我們已經對模型行為做了一定調整 , 增加“過度使用提醒” , 溫和地提示用戶使用過度 。 這只是開始 , 我們會繼續改進 。
我們公司有資本做這些改進 , 也沒動力讓你花更多時間在產品上 。 我們的商業模式很簡單:免費用 , 喜歡就訂閱 。 沒有其他的角度了 。
我堅信我們有能力做出正確的選擇 , 但我們仍需付諸行動——這項工作已經開始 , 并且不會停止 , 直到我們能毫不猶豫地向身處困境的家人推薦這款產品 。
我們經常用這樣的思維實驗來要求自己:如果你認識某個正經歷人生低谷的人 , 也許他們剛遭遇分手 , 也許他們對生活感到迷茫 , 你是否能真心實意、滿懷信心地向他們推薦ChatGPT?對我們而言 , 這就是衡量標準 。 我們將持續努力 , 直到達成這個目標 。
主持人:聽起來 , 按照你自己的說法 , 這個標準還沒有完全達到 , 但人們已經在這樣使用產品了 。 不過沒關系 , 因為你們正在朝著這個目標努力?
Nick Turley:我不確定是否說這個標準尚未達到 。 確實有一些情況中 , 我們覺得產品未能達到自己的預期 , 也有用戶在某些場景中遇到困難 。 但對我們來說 , 我希望能夠自信地說這款產品非常出色 , 而這是一種選擇 。
我們完全可以簡單地禁用這些使用場景 , 然后說:“抱歉 , 我無法幫你解決這個問題 。 ”如果我們覺得有人試圖獲取人生建議或遇到一些困難 , 這可能是最簡單的解決辦法 。
但對我以及我們團隊來說 , 潛在的好處實在太大了 。 我認為我們實際上有機會為那些沒有資源或傾訴對象的人提供一個“陪練伙伴” 。
正因如此 , 我們會在這方面努力 , 希望最終能給出一個明確的肯定答案 , 讓我能夠放心地告訴人們在遇到困難時更多地使用這款產品 。 我認為我們有機會實現這一點 。

三、負面反饋并未影響ChatGPT使用率 , 模型自動選擇器會繼續存在主持人:到這期節目播出時 , GPT-5的發布和GPT-4o的回歸已經過去一周了 。 這些負面反饋是否影響了ChatGPT的使用情況?從你們內部的數據看 , 整體數字是在上升嗎?最活躍用戶的使用量是否有所下降?
Nick Turley:使用量和增長情況看起來非常好 , 完全符合我們的預期 。 現在下結論還為時過早 , 但在第二天 , 我們的API使用量就大幅增長 , 這是開發者基于GPT-5構建應用的結果 。 GPT-5在ChatGPT的使用量也呈現出非常積極的增長 。
為這么多不同類型的用戶構建產品 , 會讓人感到困惑 。 一方面 , 有一小部分重度用戶對GPT-5的發布方式提出了反饋 , 我認為他們的意見非常合理 。
另一方面 , 還有一大批更典型的普通消費者用戶 , 這是他們第一次真正接觸并體驗到一個具備推理能力的模型 , 以及隨之而來的靈感火花 。 我認為這非常了不起 , 而且會在數據中體現出來 。
因此 , 盡管發布僅四天 , 我不愿過早下結論 , 但所有指標都是積極的 。 這也是為什么我們需要既關注數據 , 也要傾聽核心用戶的反饋 , 因為數據可能無法充分反映他們的真實感受 。
主持人:那為什么要帶回GPT-4o?既然數據沒問題 , 保留舊模型不是要多花GPU成本嗎?
Nick Turley:因為我們相信好產品要同時滿足兩端:一類是普通用戶 , 比如我們的家人 , 他們可能對AI不太熟悉;另一類是重度用戶 。 我認為 , 介于兩者之間的模糊地帶通常不是一個好選擇 。
這也是我之前提到macOS的原因 。 我認為他們在這一點上做得非常出色 , 我參考這類產品來思考如何處理這種情況 。
是的 , 保留舊模型有成本 , 但我們更看重長期價值 。 如果只盯著短期指標做決策 , 產品很容易垮掉 。
主持人:我很喜歡這次的“模型統一選擇器”設計 。 在發布前的幾個月就有報道稱 , 你們計劃將模型統一到一個系統中 , 用戶無需再手動切換 。 作為ChatGPT的用戶 , 我之前確實感受到了切換模型帶來的認知負擔 , 而你們也發布了一些數據 , 顯示由于需要選擇 , 推理模型使用率很低 。
現在 , 你們因為未保留GPT-4o而遭到用戶抗議 , 這是否意味著模型選擇器的概念已經失敗了?我們還會繼續看到它的存在嗎?
Nick Turley:在設置中 , 我們會提供一個選項 , 讓用戶可以選擇啟用完整的模型列表(如果真的需要) 。 如果你是重度用戶 , 喜歡模型的概念 , 覺得自己理解模型的區別 , 可以處理這種復雜性 , 我們會讓你這么做 。 如果你不需要 , 也可以不啟用 。
我們的目標始終如一:對于普通用戶 , 他們應該能夠直接向產品提問 , 而無需思考該選擇哪種模式 。 隨著時間的推移 , 他們甚至可以用它做更多事情 , 而不僅僅是提問 。
因此 , 我們會為90%的用戶保留簡潔性 , 同時為那些發聲的重度用戶提供他們想要的東西——完整的模型列表 。 我認為這是一種很好的平衡方式 。
通常 , 我討厭僅僅因為人們無法達成一致就添加一個設置 。 但在這種情況下 , 分歧確實很大:像你這樣的人對GPT-5的改動感到滿意 , 而另一部分人則非常不滿 。 這是一個平衡雙方需求的好方法 。

四、發布后模型新能力不斷涌現 , 產品大部分價值都是經驗性的主持人:最近有很多關于人們如何使用ChatGPT及其潛在負面影響的頭條新聞 。 《華爾街日報》最近報道了一個人因危險的妄想而使用ChatGPT , 而ChatGPT承認這讓情況變得更糟 。 《紐約時報》的標題是:“聊天機器人可能陷入妄想螺旋 。 ”《大西洋月刊》的標題是:“ChatGPT提供了謀殺、自殘和魔鬼崇拜的指導 。 ”
此外 , 還發生了一起事件:通過你們的分享功能 , 人們(可能無意中)分享了一些對話 。 雖然分享流程中有同意選項 , 但許多人并未意識到他們分享的是相當私密的對話 , 甚至可能被谷歌收錄和索引 。 OpenAI稱這是一個實驗 , 并已撤回該功能 。
我想知道你們從中學到了什么 , 以及過去幾個月這些頭條新聞對你作為產品負責人有何具體影響 。
Nick Turley:是的 , 我從ChatGPT發布前就參與其中 , 感覺就像在三、四家不同的公司工作過 , 因為隨著規模的擴大 , 你必須以全新的方式思考和運營產品和業務 。
我認為 , 當周活躍用戶數即將突破10億(我們剛剛超過7億)時 , 確實需要深思:“我們的用戶群體有哪些?如何確保產品滿足所有人的需求?”
我們討論了很多關于普通用戶和重度用戶的問題 , 但你也必須假設有些人可能不會像老用戶那樣仔細閱讀界面 。
關于你提到的功能 , 我想直接回應:我們曾允許用戶在分享時選擇是否讓對話被谷歌收錄 。 你可以認為每個選擇同意的人都清楚自己在做什么 , 但也可以認為很多人只是粗略閱讀并可能誤勾選選項 , 導致對話被收錄 。
這個想法本身沒有問題 。 我們試圖解決的問題是:人們在使用AI時有很多值得探索的場景 , 如果能更容易看到其他人的創意用法會非常棒 。 但這個想法有多種實現方式 。
在這種情況下 , 經過進一步考慮 , 我們認為這可能不是我們想要的方向 。 隨著規模的擴大 , 責任也隨之而來 , 包括更謹慎地考慮那些可能無意中犯錯的用戶 。
另一方面 , 我不斷學到的是 , 發布后我們才能更深入地了解模型的涌現能力 。 我從未參與過一款產品 , 其大部分價值是經驗性的 。 通常 , 當你開發一款技術產品時 , 你在發布前就知道它能做什么 , 只是不確定人們是否會喜歡 。 但在AI領域 , 發布后仍然在不斷學習產品的功能 。
像GPT-5這樣的產品 , 讓我對人們的用法感到震驚 。 它在編寫前端代碼(比如非常漂亮的應用程序)方面表現非常出色 。 這讓我對未來的可能性充滿期待 。
在實驗室中構建時 , 你可能有一種觀點 , 但隨著更多人使用 , 你會快速更新認知 , 因為你能看到他們實際在做什么 。
我們在不同用戶群體及其偏好方面學到了很多 , 但我也看到了網絡上人們用新模型做的許多神奇的事情 。 我必須關注這些 , 因為它們可能會開啟下一個路線圖 。
主持人:是的 , 我對這些有趣的事情很感興趣 , 也想討論它們 。 但在那之前 , 我認為人們有一種感覺:這是一個“潘多拉魔盒”時刻 , 你們可能無法完全控制人們使用這項技術的負面方式 , 尤其是在你們當前的規模下 。
這讓我想起2010年代中期對社交媒體的報道 , 當時也有類似的討論 。 社會可能已經向前發展 , 但與此同時 , 這些技術也帶來了許多負面影響 。 我想請你作為產品負責人 , 直接回應那些頭條新聞 。
Nick Turley:首先 , 我要明確表示:我們還有很多工作要做 。 我們已經開始行動 , 與30多個國家的90多位專家進行了交流 。 針對不同的心理健康場景 , 我們已經迭代了模型行為 。 當用戶過度使用產品時 , 我們也推出了調整措施 。
但工作遠未結束 。 因此 , 我們非常期待在GPT-5的基礎上快速推出一系列改進 。 GPT-5是一個很好的基線 , 它實際上減少了阿諛奉承的情況 , 并在許多我們擔心的維度上有所提升 。 但我們仍會繼續迭代 。
你可以將其與社交媒體的討論相提并論 , 但對我來說 , 這感覺有些不同 , 因為我認為我們的動機 , 與在產品中做正確的事情是一致的 。 我們可能尚未完全實現目標 , 還有更多工作要做 。 但從根本上說 , 我們真正關心的是幫助你實現目標 , 無論是保持健康、創業、發揮創造力 , 還是寫一封更好的郵件 。
這也包括用戶的長期目標 , 比如成為更好的自己 。 如果他們通過ChatGPT處理一些棘手的情況 , 我們也希望提供幫助 。 在任何情況下 , 我們的動機都不是提供糟糕的人生建議 。 與社交媒體不同 , 我并不覺得業務需求與正確做法之間存在沖突 。
我們還有工作要做 , 但我認為我們具備做正確事情的前提條件 。

五、用戶付費率沒有出現下滑 , 正與商家探討交易抽傭主持人:我很高興你談到了商業模式 , 這是我一直想問的問題 。 ChatGPT的免費用戶和付費用戶比例是多少?據我了解 , 不到10%的用戶是付費用戶 , 絕大多數是免費用戶 。 對嗎?
Nick Turley:絕大多數是免費用戶 。 我們上次公布的付費用戶數是2000萬 。
主持人:所以你們有數億免費用戶和數千萬付費用戶 。 你們通過訂閱賺錢 。 過去一年 , ChatGPT的用戶規模大約翻了兩番 , 因此收入確實可觀 。
與此同時 , 我和業內人士看到的是 , 隨著用戶規模達到數十億 , 從長遠來看 , 僅靠訂閱可能無法支撐業務 。 這自然引出了廣告的問題:廣告是否會進入ChatGPT?如果是 , 你們如何考慮這一點?
Nick Turley:首先 , 我對訂閱模式是否會停滯的前提提出質疑 。 我們最初選擇訂閱模式并不是因為它是最好的盈利方式 , 而是因為當時我們無法滿足需求 , 需要一種限制流量的方法 。
這是訂閱模式的起源 , 后來我們逐漸發現這是一種非常棒的商業模式 , 因為它與用戶的利益高度一致 。
但我一直驚訝地發現 , 即使是最近的用戶群體 , 其付費率也與早期用戶相當甚至更高 。 通常情況下 , 隨著產品成熟 , 付費率會逐漸下降 。 因此 , 我對訂閱模式非常樂觀 。
我們在企業市場的探索才剛剛開始 。 付費企業用戶數從幾個月前的300萬增長到了500萬 。 這是一個全新的領域 , 我認為ChatGPT不僅是一款出色的消費級產品 , 也是新一代用戶用戶工作場景的生產力工具 。 如果我們能實現安全、合規、協作且適合工作的產品使用方式 , 這將是一個非常有潛力的業務 。
因此 , 我并不認為絕大多數用戶是免費用戶是一種負擔 。 相反 , 我認為這是一個可以構建差異化服務的漏斗 , 為愿意付費的用戶提供價值 。 Netflix等其他標志性的消費級訂閱服務的用戶規模遠高于ChatGPT 。
主持人:Nick , Netflix現在也有廣告了 。
Nick Turley:確實如此 。 既然你一直想讓我談談廣告的問題 , 我現在已經學會謙遜了 , 不會對這種問題輕易做出瘋狂、極端或長期的斷言 。
也許在某些市場上 , 用戶不愿意付費 , 但我們仍希望提供最優質、最新鮮的服務 。 這種情況下 , 或許可以考慮其他間接的變現方式 。
如果我們真的要走這條路 , 我會非常謹慎和深思熟慮 , 因為我認為ChatGPT的魔力在于它能為你提供最符合需求的答案 , 中間沒有其他利益相關者干擾 。 它是根據你的需求和偏好量身定制的 , 而不是為了推銷某個付費產品或服務 。
也許存在某種廣告形式能保留這種純粹性 , 同時維持激勵結構 , 但這將是一個全新的概念 , 我們必須非常慎重 。 我保持開放態度 , 不會完全排除這種可能性 , 但我們必須深思熟慮 , 確保體驗優雅 。
另外 , 我們還會開發其他產品 , 那些產品可能有不同的維度 。 也許ChatGPT本身就不適合廣告 , 因為它完全以用戶目標為核心 。 但這不意味著我們未來不會開發其他類型的產品 。
我認為保持靈活性是好的 , 但我也想強調訂閱模式的巨大優勢——它的增長速度非常快 , 而且還有很多未開發的潛力 。
主持人:商業合作是更近期的機會嗎?你們最近在ChatGPT中增加了購物功能 , 展示商品 。 我猜下一步自然就是從中抽取交易傭金了?
Nick Turley:關于ChatGPT的商業模式 , 我認為主要有三種可能:一是我們已經實施的訂閱制;二是廣告 , 雖然有很多弊端 , 但或許能優雅地實現;第三種既非廣告也非訂閱 , 而是用戶在獨立推薦后通過產品購買——就像Wirecutter通過專家精選商品賺取傭金那樣 。
我們正在與商家合作伙伴探索這種模式 。 我不確定這是否是最佳模式 , 甚至不確定用戶體驗是否達標 , 但我對此非常興奮 , 因為它可能既保留ChatGPT的魔力 , 又能讓商家獲得成功 , 同時建立可持續的業務 。 我們稱這個項目為“ChatGPT商業” , 重點是確保用戶首先獲得價值 。 這是我們的基本原則 。
我想確保用戶通過聊天發現和購買商品的過程真正有吸引力 。 實際上 , 商品發現已經在發生了 , 尤其是那些傳統電商不擅長的領域 。
比如你不會上網買車 , 但可能會和ChatGPT討論;你不會上網買房 , 但可能會咨詢ChatGPT 。 從用戶行為來看 , 這里存在巨大機會 。
但我告訴團隊 , 在考慮商業化之前 , 首先要確保用戶體驗足夠好 。 不過 , 收取推薦傭金確實是個有趣的方向 , 我們正在與一些商家積極探討 。
主持人:你們會堅持不讓傭金影響ChatGPT的推薦內容嗎 , 這是一條紅線嗎?
Nick Turley:這一點至關重要 。 我們所有內部演示都明確體現了這一點 。 實際上 , 我最大的擔憂是即使用戶體驗設計再清晰 , 不同用戶可能仍會產生誤解 。 但沒錯 , ChatGPT的魔力在于它能完全獨立地選擇推薦內容 , 不受任何干擾 , 這一點必須堅守 。

六、靠三種方式實現產品增長 , 用戶還需學會“分配任務”的思維主持人:我們來聊聊ChatGPT的現狀 。 它是有史以來增長最快的消費級產品 , 用戶規模在過去一年幾乎翻了兩番 。 外界很好奇這種增長從何而來 。 能分享一下增長動力、主要市場和用戶畫像嗎?
Nick Turley:ChatGPT上線后我招的第一個員工就是數據科學家 , 因為當時我非常困惑——每個用戶給出的使用理由都不同 。
后來我們逐漸理清了主要場景:寫作、編程等技術需求、閑聊、信息查詢等 。 這些核心用例至今未變 。
變化主要來自三方面:一是純粹的模型改進 , 比如行為模式、能力提升和拒絕不當請求的準確性;二是混合了產品和科研的能力提升 , 比如搜索功能和個人化改進 。
三是經典的“增長工作” , 我們其實做得很少 , 但比如取消登錄限制就獲得了很大的成功 , 這與用戶需求一致——這并非什么黑科技增長手段 , 而是降低了使用門檻 。 這三類改進各占三分之一 。
但同時 , 我也注意到人們與這項技術的關系發生了變化——我一直認為 , 使用ChatGPT主要瓶頸在于:人們是否知道它能做什么;用戶是否足夠了解自己 , 從而清楚可以委派它完成哪些任務 。
關于第一點 , 我認為觀察周圍人如何使用ChatGPT會產生自然效應 。 大量發現其實發生在產品之外 。 如果你上TikTok , 會看到人們分享使用案例的視頻 , 評論區有成千上萬條留言 , 涵蓋各種應用場景 。
就像在線Instant Pot(快煲電壓力鍋)社區分享菜譜一樣 , 人們現在分享提示詞 。 這種生態需要時間發展 , 讓人們觀察他人的做法 。
因此 , 我認為這個“空盒子問題”(指用戶不知如何利用產品)正在通過產品外的發現機制逐漸緩解 。
另一點更偏哲學層面 , 但我深信:對大多數人而言 , “分配任務”是非常反直覺的行為 。 我在硅谷擔任管理者 , 必須學習如何分派任務 。 但ChatGPT的周活躍用戶已占全球人口10% , 對其中大多數人來說 , “我有任務要分配給某人”這種思維并不自然 。
這需要用戶真正理解自我 , 并在使用產品后通過反思才能掌握 。 這與產品功能、營銷或社會無關 , 純粹需要時間讓用戶消化、嘗試和學習 。 我認為這也是增長的重要驅動力 。
主持人:當前用戶增長是否呈現全球均衡分布?是否存在高度集中的國家?假設未來6個月不對ChatGPT做重大改動(雖然這不可能) , 您認為增長會保持現有速度嗎?是否感覺到增長天花板?
Nick Turley:首先 , ChatGPT是真正的全球現象 。 我們關注所有特定市場 , 像印度這樣潛力巨大的國家令人興奮 , 但很難找到ChatGPT未增長的國家 。
當然 , 不同國家的商業化率差異明顯——這在我們的商業模式下顯而易見 , 某些歐洲或亞洲國家的付費用戶比例更高 。
為避免透露未公開數據 , 可以說絕大多數國家都呈現健康增長 , 發展中國家市場是最大的未開發機會 , 而GDP越高商業化率越高 。
即使現有增長也是產品多次迭代的復合效應 。 要保持驚人增速就必須持續改進 。 眾所周知 , 許多決心堅定的公司正以我們為目標 , 其中多家在分銷渠道上比OpenAI更具優勢 。
這意味著它們能直接復制我們的產品并觸達海量用戶 。 我在制定路線圖時 , 始終假設它們會成功 。 最終時間會給出答案的 。
主持人:不過令人驚訝的是 , 這些產品還不是很成功 , 馬斯克、扎克伯格等人的嘗試至今尚未遏制ChatGPT的增長 。
Nick Turley:我認為我們的產品具有獨特優勢:尖端技術 。 用戶覺得使用ChatGPT就能獲得最智能的工具 , 這種認知至關重要——即使技術基準測試的意義逐漸減弱 。
此外 , 我們構建了出色的產品功能:記憶與個性化非常亮眼 , 搜索體驗相比一年前大幅提升 。 用戶真心喜愛我們的產品 , 復制難度超乎想象 。 即便規劃路線圖時 , 合理的想法是其他人也會成功 。
另一個常被低估的因素是“使用意圖” 。 如果用戶打開產品是為消遣 , 突然看到實用性的ChatGPT克隆版 , 即使獲得很多因興趣而產生的點擊 , 也難引發深度參與 。
不過話說回來 , 我認為我們不能滿足于暫時的領先 。 我始終向團隊灌輸“創業首日”心態(這對成立僅三年的公司不難) 。 用戶有大量新興問題需要解決 , 而這些問題的處理需要極其細致的把握 。 因此 , 盡管增長勢頭令人振奮 , 但我們的工作遠未完成 。

七、ChatGPT只是個臨時原型 , 對產品形態有更宏大愿景主持人:作為重視事實的記者 , 阻礙我更頻繁使用的原因是幻覺(hallucination) 。 根據GPT-5模型卡 , 約十分之一的響應可能包含幻覺 , 雖比之前改善但仍不理想 。 您認為可能完全消除幻覺嗎?
Nick Turley:我以前認為不可能 。 現在我們必須為此制定計劃 , 這也是搜索功能如此重要的原因 。 我依然堅信 , 正確的產品形態必然是大語言模型與事實依據相連——這正是我們在ChatGPT中整合搜索功能的原因 , 我認為這帶來了質的改變 。
企業場景也是如此 , 當模型接入企業數據時 , 我們就有事實依據進行校驗 。 這種動態關系不會消失 。 不過必須說 , GPT-5在克服幻覺方面的進展令我震驚 , 無論是聊天版本的GPT-4o還是思考版本的OpenAI o3都有顯著提升 。
我們團隊有些研究人員對此非常樂觀 。 但可靠性的特殊之處在于:從“高度可靠”到“百分百可靠”之間存在巨大鴻溝 , 這會從根本上改變產品定位 。 除非我們能證明在所有領域(而不僅是某些領域)都比人類專家更可靠 , 否則我們仍會建議用戶核查答案 。 人們仍會將ChatGPT作為第二意見來源 , 而非首要事實依據 。
主持人:你認為一年后就不再需要提醒用戶核查了嗎?還是需要更長時間?
Nick Turley:我希望實現這個目標 。 因為這關乎那些最關鍵的應用場景——如果能將ChatGPT用于高風險領域就太棒了 。 無論是醫療建議、法律咨詢 , 還是其他準入門檻高的敏感領域 , 都能構想出更好的解決方案 。
我希望能實現 , 但已學會不做年度預測 。 現在我只做兩種判斷:最終會實現的 , 和下一季度能實現的 。 因為中期預測往往失準 。 我確信最終會解決幻覺問題 , 也確定下個季度還做不到 。 不過GPT-5在這方面已是巨大飛躍 。
主持人:你們的路線圖真的只規劃六個月嗎?
Nick Turley:基本如此 , 但有例外 。 我強調這點是因為希望人們理解:在持續變化的技術基礎上構建產品需要特殊的實證精神——這是其他類型公司無需面對的 。 但企業版路線圖不同 , 當財富500強企業詢問合規功能的上線時間時 , 我們必須給出明確答案 。
所以取決于具體領域 。 像“GPT-6何時發布”這種問題——請別問我——這類創新很難做6個月以上的高置信度規劃 , 因為一切都在飛速變化 。
主持人:有位前同事匿名提問:為什么ChatGPT的產品形態始終沒有大變化?
Nick Turley:我也思考過這個問題 。 很多人知道 , ChatGPT原本只是個用于更宏大產品的臨時原型 。 我們本想打造“超級助手”——能通過多種形態提供全方位幫助的產品 。
ChatGPT只是收集使用案例的起點 , 但我們顯然偏離了這一計劃 , 沒想到它自己就取得了成功 , 這種聊天的形式展現出了出乎意料的持久力 。
自然語言交互是非常強大的 , 它也將繼續存在 , 但是否以聊天機器人的形態存在是一個不同的問題 。
用戶能以自然的方式表達自己的想法 , 已經是終極的用戶體驗了 , 人類就是這么被“訓練”出來的 。 只要你是在為人類構建技術 , 就一定要讓他們以自然的方式與軟件溝通 。
但我并不認為自然語言交互界面就等同于聊天形式 。 我們非常期待能突破傳統聊天框的形態 。 Canvas就是朝這個方向邁出的第一步——這個功能讓你能與AI協同迭代創作一件作品 , 而非來回對話 。
借助GPT-5強大的前端能力(它能生成非常精美的軟件界面) , 完全可以設想它能根據不同使用場景實時渲染不同的用戶界面 , 這將是Canvas功能的進階版 。
比如數據分析時 , 它能生成電子表格;規劃旅行時 , 能創建一個小型網頁應用供你和朋友共同策劃 。 各種交互形態都可能自然涌現 。 就聊天界面而言 , 它確實是技術發展特定階段的必然選擇——在ChatGPT之前也有聊天機器人 , 但體驗欠佳 , 直到模型能力的突然提升 , 給人帶來震撼的體驗 。
而這種按需生成定制化軟件的能力 , 通過自然語言驅動更豐富的UI交互 , 現在或很快也將帶來同樣的震撼體驗 。
長話短說 , 雖然我也困惑于我們仍在沿用聊天機器人形式 , 但我們對產品形態有著更宏大的愿景 , 而且技術發展終將使之成為可能 。
主持人:關于“超級助手”的戰略目標 , 你們團隊有一份文件在谷歌反壟斷案中被提及 , 其中提到希望打造“人們連接互聯網的界面” 。 這顯然意味著必須突破聊天形式 , 甚至需要涉足網頁瀏覽領域——近期也有相關報道 。
我很好奇你在谷歌反壟斷案作證時甚至提到 , 如果谷歌被迫拆分Chrome , OpenAI可能有興趣收購 。 你們正在開發自己的瀏覽器嗎?OpenAI是否需要為ChatGPT配套專屬瀏覽器?
Nick Turley:這個表態被嚴重斷章取義了 。 我的完整回答是:如果Chrome真的上市出售 , 想必多方都會考慮 , 我們也不例外 。 這比網絡流傳的版本謹慎得多 。
從產品角度看 , ChatGPT已經成為接入互聯網的新入口——10年前需要瀏覽器完成的許多操作 , 現在直接問ChatGPT就能獲得答案 。 想象未來你能通過它發現商品、了解信息直至完成購買 。
當AI能持續處理更復雜的任務(比如旅行規劃或數據分析) , 這些原本需要打開多個應用的操作 , 未來可能直接在AI中啟動 。
因此ChatGPT逐步覆蓋瀏覽器的功能并非天方夜譚 , 具體形態我們仍在探索 。 那份文件確實出自我手——我認同ChatGPT終將承擔越來越多現有瀏覽器的職能 。

八、與蘋果合作進展順利 , 或將允許用戶自定義AI人格主持人:我想快問快答幾個關于產品策略的問題 。 Sam多次提到“用ChatGPT登錄”具有重要戰略意義——這種能讓用戶帶著個人賬戶和個性化設置瀏覽網頁的功能 , 未來可能像谷歌或蘋果賬號那樣成為登錄選項 。 你對此怎么看?
Nick Turley:我們正在積極探討 。 根據以往經驗 , 在構建生態系統時——無論是自主開發還是與他人合作——都必須謹慎行事 , 因為機會有限 。 目前我們已就該構想與眾多合作伙伴展開討論 , 對此仍充滿期待 。
主持人:有傳言說你們不會和Jony Ive(蘋果前首席設計官)合作開發眼鏡或手機產品?
Nick Turley:關于硬件路線圖我無可奉告 。 不過這個領域確實令人振奮 , 總能帶來靈感 。
主持人:與蘋果的合作進展如何?
Nick Turley:非常順利 。 我們對正在推進的項目感到興奮 , 這將是長期合作 。 我期待將AI技術——希望是我們的模型 , 但更廣義的AI——融入iOS的每個角落 。
主持人:所以你認為雙方合作會持續深化?
Nick Turley:雖然我不是專家 , 但從純產品角度看 , 確實存在無數合作可能性 。
主持人:你們宣布與芭比制造商美泰合作 , 將模型植入玩具 。 為何選擇這個方向?
Nick Turley:我們不僅是產品公司 , 更是平臺公司 。 在自主開發產品的同時 , 也致力于為所有人提供基礎模塊 。 這個合作就是典型案例——玩具制造顯然不屬于我們的主營業務(盡管我們涉足的領域總是出人意料) 。 但通過API賦能其他企業開發新產品 , 正是平臺價值的精彩體現 。
主持人:ChatGPT何時實現完全多模態?目前支持部分模態 , 但視頻輸入/輸出、音頻輸入/輸出等功能何時全面開放?
Nick Turley:我們的終極目標是實現類人交互 。 就像此刻你我交談時會互相打斷 , 你會點頭反饋 。 技術路線圖的核心就是讓用戶更自然地表達 , 讓AI更準確地反饋——這才是發揮模型智能的關鍵 。
雖然“任意輸入/輸出”在技術層面已可實現 , 但要讓交互真正自然仍面臨挑戰 。 比如最新語音模式雖已顯著進步 , 但距離通過圖靈測試還有差距——你仍能察覺正在與AI對話 。 我們正在研究這些人際交互的微妙之處 。 因此既要推進技術研發 , 更要打磨自然流暢的交互體驗 。
主持人:剛剛推出的四項人格測試功能 , 最終會發展成數十種預設人格 , 還是讓用戶完全自定義ChatGPT人格?
Nick Turley:目前尚無定論 。 我們正通過現有四項人格收集數據 , 觀察用戶需求是否集中在這幾類 , 抑或存在長尾分布 。 就現階段思考而言 , 我認為應該允許用戶自主配置 。 現有自定義指令功能配合這四項人格作為起點 , 就像先選擇合拍的基礎人格 , 再通過日常互動或主動設置進行個性化調整 。
這類似于交友過程:初識時因性格投緣成為朋友 , 之后共同成長演變 。 ChatGPT也將如此——我們會提供更貼合的初始選項 , 但后續個性化調整將完全因人而異 。

    推薦閱讀