不是GPT-5.4,OpenAI深夜發新模型!幻覺率暴降29%

不是GPT-5.4,OpenAI深夜發新模型!幻覺率暴降29%

智東西
作者|王涵
編輯|李水青
智東西3月4日報道 , 今天 , OpenAI正式發布GPT?5.3 Instant , 該模型在回答的語氣傾向、回復相關度以及對話的順暢度均有相應的提升 。
OpenAI團隊稱其收到用戶反饋 , GPT?5.2 Instant有時會拒絕回答本可以安全響應的問題 。 在涉及敏感話題時 , 模型的表現偶爾顯得過于保守或帶有說教感 。
GPT?5.3 Instant的回答將直擊重點 , 不再夾雜冗長的限制性說明 , 顯著減少了不必要的拒答行為 , 并削減了回答前那些過度防衛或帶有說教色彩的開場白 。
此外 , GPT?5.3 Instant還優化了聯網搜索結果的整合質量 , 模型現在能更有效地平衡搜索結果與自身知識儲備及邏輯推理 。 例如 , 它能夠利用既有的認知圖譜為近期資訊提供深度背景解析 , 不再是簡單地羅列并匯總搜索信息 。
從更廣泛的層面來看 , GPT?5.3 Instant降低了對聯網搜索結果的過度依賴 , 解決了此前偶爾出現的“鏈接堆砌”或信息松散的問題 。 它現在能更精準地洞察問題的潛臺詞 , 并在回答開頭即優先呈現核心信息 。
此前 , GPT?5.2 Instant的語氣偶爾會讓人感到“尷尬、違和” , 表現為言語過于強勢 , 或者在未獲確認的情況下 , 就對用戶的意向和情緒進行過度解讀或妄加揣測 。
本次更新大幅削減了不必要的冗余宣告 , 以及類似“停一下 , 深呼吸”等口吻 。 用戶可以在設置中調整模型的回復語調 , 例如其親和力與熱情度 。
相比GPT?5.2 Instant, GPT?5.3 Instant提供的回答更具事實性 , 在廣泛的話題領域內均顯著降低了幻覺率 。
為了衡量準確度 , OpenAI團隊采用了兩項內部評估指標:其一側重于醫療、法律及金融等高風險領域;其二則專門針對“幻覺”高發場景進行測試 , 樣本取自經過脫敏處理、被用戶標記為事實錯誤的真實對話記錄 。
對比前代模型 , GPT?5.3 Instant在“高風險領域”評估中 , 聯網模式下的幻覺率降低了26.8% , 僅依靠模型自身知識庫時 , 幻覺率降低了19.7% 。
而在基于用戶真實反饋的評估中 , 該模型在聯網模式下的幻覺率下降了22.5% , 非聯網模式下則下降了9.6% 。
在故事寫作方面 , GPT?5.3 Instant在處理實用任務與表達性寫作之間切換得更加順暢 , 且不會犧牲邏輯的清晰度與連貫性 。
OpenAI團隊補充到 , GPT?5.3 Instant仍存在一些改進空間 。 例如ChatGPT在某些語言 , 如日語和韓語 , 中的回復風格可能稍顯生硬 , 或帶有刻板的直譯感 。 并且 , OpenAI團隊仍在持續監控反饋并進行功能優化 , 同時也在不斷擴展自定義選項 。
GPT?5.3 Instant自即日起面向所有ChatGPT用戶開放 , 開發者也可通過API使用名為gpt-5.3-chat-latest的模型 。 Thinking和Pro版本的更新也將于近期推出 。
GPT?5.2 Instant將在“Legacy Models”下拉菜單中為付費用戶保留三個月 , 并計劃于2026年6月3日正式退役 。

結語:OpenAI用對話挽留用戶GPT?5.2 Instant在回答中的“油膩”“冗雜”的套路句式一直被廣大用戶所詬病 , 此次GPT?5.3 Instant的升級更新 , 將視角重新放回“聊天”上 , 回應了用戶長期以來對聊天機器人 “好用、實在、不繞彎” 的核心訴求 。
在3月初 , OpenAI因與美國軍方簽訂合作協議 , 大批用戶開始發起“抵制ChatGPT”等活動 , Anthropic更是直接推出了一鍵轉移上下文內容的服務 , ChatGPT的用戶或正在流失 。
【不是GPT-5.4,OpenAI深夜發新模型!幻覺率暴降29%】OpenAI在此時優化對話風格或許也是其試圖留住用戶的舉措 。

    推薦閱讀