不是GPT-5.4，OpenAI深夜發新模型！幻覺率暴降29%

2026-04-07 人工智能 ai 科大訊飛 Salesforce 保險業

智東西
作者｜王涵
編輯｜李水青
智東西3月4日報道，今天， OpenAI正式發布GPT?5.3 Instant ，該模型在回答的語氣傾向、回復相關度以及對話的順暢度均有相應的提升。
OpenAI團隊稱其收到用戶反饋， GPT?5.2 Instant有時會拒絕回答本可以安全響應的問題。在涉及敏感話題時，模型的表現偶爾顯得過于保守或帶有說教感。
GPT?5.3 Instant的回答將直擊重點，不再夾雜冗長的限制性說明，顯著減少了不必要的拒答行為，并削減了回答前那些過度防衛或帶有說教色彩的開場白。
此外， GPT?5.3 Instant還優化了聯網搜索結果的整合質量，模型現在能更有效地平衡搜索結果與自身知識儲備及邏輯推理。例如，它能夠利用既有的認知圖譜為近期資訊提供深度背景解析，不再是簡單地羅列并匯總搜索信息。
從更廣泛的層面來看， GPT?5.3 Instant降低了對聯網搜索結果的過度依賴，解決了此前偶爾出現的“鏈接堆砌”或信息松散的問題。它現在能更精準地洞察問題的潛臺詞，并在回答開頭即優先呈現核心信息。
此前， GPT?5.2 Instant的語氣偶爾會讓人感到“尷尬、違和” ，表現為言語過于強勢，或者在未獲確認的情況下，就對用戶的意向和情緒進行過度解讀或妄加揣測。
本次更新大幅削減了不必要的冗余宣告，以及類似“停一下，深呼吸”等口吻。用戶可以在設置中調整模型的回復語調，例如其親和力與熱情度。
相比GPT?5.2 Instant， GPT?5.3 Instant提供的回答更具事實性，在廣泛的話題領域內均顯著降低了幻覺率。
為了衡量準確度， OpenAI團隊采用了兩項內部評估指標：其一側重于醫療、法律及金融等高風險領域；其二則專門針對“幻覺”高發場景進行測試，樣本取自經過脫敏處理、被用戶標記為事實錯誤的真實對話記錄。
對比前代模型， GPT?5.3 Instant在“高風險領域”評估中，聯網模式下的幻覺率降低了26.8% ，僅依靠模型自身知識庫時，幻覺率降低了19.7% 。
而在基于用戶真實反饋的評估中，該模型在聯網模式下的幻覺率下降了22.5% ，非聯網模式下則下降了9.6% 。
在故事寫作方面， GPT?5.3 Instant在處理實用任務與表達性寫作之間切換得更加順暢，且不會犧牲邏輯的清晰度與連貫性。
OpenAI團隊補充到， GPT?5.3 Instant仍存在一些改進空間。例如ChatGPT在某些語言，如日語和韓語，中的回復風格可能稍顯生硬，或帶有刻板的直譯感。并且， OpenAI團隊仍在持續監控反饋并進行功能優化，同時也在不斷擴展自定義選項。
GPT?5.3 Instant自即日起面向所有ChatGPT用戶開放，開發者也可通過API使用名為gpt-5.3-chat-latest的模型。 Thinking和Pro版本的更新也將于近期推出。
GPT?5.2 Instant將在“Legacy Models”下拉菜單中為付費用戶保留三個月，并計劃于2026年6月3日正式退役。

結語：OpenAI用對話挽留用戶GPT?5.2 Instant在回答中的“油膩”“冗雜”的套路句式一直被廣大用戶所詬病，此次GPT?5.3 Instant的升級更新，將視角重新放回“聊天”上，回應了用戶長期以來對聊天機器人 “好用、實在、不繞彎” 的核心訴求。
在3月初， OpenAI因與美國軍方簽訂合作協議，大批用戶開始發起“抵制ChatGPT”等活動， Anthropic更是直接推出了一鍵轉移上下文內容的服務， ChatGPT的用戶或正在流失。
【不是GPT-5.4，OpenAI深夜發新模型！幻覺率暴降29%】OpenAI在此時優化對話風格或許也是其試圖留住用戶的舉措。

推薦閱讀

上一篇：蘋果突然連夜推系統，只為給新硬件鋪路，iOS26.3正式版真要來了

下一篇：招商證券：全球AI眼鏡行業正迎來歷史性“iPhone時刻”