
文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片
Gemini 3 還沒影子 , GPT 5.1 已經在路上 。 7 號深夜 , OpenRouter 平臺上線了一個全新的隱名模型 。 已經有眼尖動作快的網友嘗鮮體驗 , 并且認為這就是披著馬甲的 GPT 5.1 , 暫名:Polaris Alpha 。
目前提供 API 調用(包括 OpenRouter) , 知識庫截止時間為 2024 年 10 月 , 不支持推理模式 。 最大 context 容量 256K , 單次最大輸出 128K 。
開發商信息保密 , 但是在網友的不懈努力下 , 成功「越獄」 , 讓 Polaris Alpha 自曝了家門 。
圖片來自 X 用戶 @LarryAtherton1
這倒也算不上實錘 , 可能只是訓練數據的問題——很多模型都會輸出來自專有供應商的數據 。 除非系統提示中明確說明 , 或者通過指令調優反復灌輸 , 否則這些模型實際上并不「知道」自己是什么 。
無論如何 , 目前暫時沒有官宣 , 暫且就還是叫它 Polaris 吧 。 APPSO 也第一時間簡單試用了一下 。 由于是通過 API , 部分功能比如處理語音素材暫時受限 , 除此之外 , Polaris 的表現 , 讓人相當期待 GPT 5.1 。
案頭工作:流暢 , 一如既往首先是一些比較基礎的簡單任務:根據要求寫郵件 。 這是一封道歉郵件 , 跟嘉賓通報活動改期 。 我特地強調了口吻要既飽含歉意 , 又表示親近 , 讓 Polaris 感受一下 。
算是中規中矩吧 , 信息齊全 , 行文邏輯清楚 , 語氣不會有強烈的「人機感」 。 比較神奇的是 , 在打開 Search 模式的前提下 , Polaris 會去檢索一些道歉信的寫法 , 而它的引用信息里 , 居然有淘寶百科…… 看上去 Polaris 覆蓋的信息源越來越多 , 也越來越冷門了 。
【GPT 5.1 披「馬甲」公測,免費可用,殺入年底大更新戰場】然后是需要創意想法的文案寫作任務 , prompt 我都給得很模糊 , 只要求有網感 , 適合在小紅書上傳播 。
Polaris 給出了三種不同的風格 , 給出的文案非常完整 。 后面還給出了活動具體執行的方案 。 從這里已經可以看出來 , 措辭上頗有 GPT 系會有的文字風格 。 也有網友專門做了相似性統計——馬甲快要披不住了 。
文字風格仍然是每一個大語言模型的立身之本 , 畢竟現在最主流的應用場景就是案頭工作 。 2026 年都快要來了 , 還給出「人機味」的文字 , 是不能被原諒的 。 目前 Polaris 的文風 , 有相當典型的「GPT」風味 , 很多網友都有同樣的感受 。
同時 , 對于 chatbot、聊天、陪伴等應用場景里 , 文風能否快速適應用戶節奏 , 并且靈活「習得」個性化的口吻 , 也將是 GPT5.1 面臨的挑戰——全球用戶要求 4o 回來的盛況 , OpenAI 應該不想再經歷一次了吧 。
由于不能直接處理音頻文件 , 我上傳了轉錄后的播客文字稿 , 讓 Polaris 整理提煉信息點 , 適當調整口語化的地方 , 重點是:根據不同的主題維度 , 拉出一個層次明確的提綱 , 同時保留時間戳 。
輸入目前看來可以超過 1w 字(單條發送) , 受限于 OpenRouter 每個窗口只能保存八條記憶的限制 , 超長輸入會一定程度的影響輸出穩定性 。 不過自我糾正能力不錯 , 第一次跑的時候生造了并不存在的時間戳 , 重抽一次之后自行糾正了 。
自從 GPT 5 之后 , ChatGPT 的單個窗口容量明顯增大 , 從社交媒體上的反饋來看 , 最高的 token 總數可以去到 60 萬-80 萬才達到上限 。 這對于個性化用戶信息而言是個非常好的信號 , 但不可避免的是 , 超長上下文額之后 , 會出現記憶調度的失序 , 以及輸出穩定性的下降 。
這留給了 GPT 5.1 全新的挑戰 , 如何在進一步擴大窗口容量之后 , 依然保持靈活準確的記憶調度 。 對于用戶而言 , 幾乎是第一秒就能感受到的決定性體驗 。
編程:超簡單 , 超順滑OpenRouter 提供幾種基礎的編程工作實現和預覽 。 我快速用它測了一下 Polaris 寫小游戲的本事 。
最直觀的感覺是時間稍微有點久 , 差不多要個五分鐘了 。 不過倒是不需要我提供復雜的 prompt , 「設計一個貪吃蛇游戲代碼」 , 就足夠生成一個可以上手的小游戲 。
甚至還提供不同的模式、設置 , 在 preview 里的試玩都很順暢 。 另外又讓它跑了一個打地鼠游戲 , 也是順利完成 。
網頁設計也很 OK , 我把上面生成出來的咖啡館文案 , 丟回給 Polaris , 讓它設計一個活動的落地頁 。
Polaris 研究了整個文案 , 并且加入了一些補充 , 最后出來的視覺效果也不錯 , 我挺喜歡它給按鈕設計的發光效果 , 這似乎是它的一個「獨家特色」 , 在其他網友的測試中也出現了:
圖片來自 X 用戶
從網上的其它測試是來看 , 它的美學表現值得期待 。
圖片來自 X 用戶 @HarshithLucky3
這些基礎工作都沒有太大的問題 , 但老實說 , 現在 AI 編程的賽道堪稱白熱化 , 而 GPT 系產品在編程上 , 競爭力一直不算很強 。 GPT 5.1 實裝后 , 在編程上的表現能不能有大突破 , 只有繼續等待才能知道 。
前陣子 Sam Altman 明確發話表示 , 年底時 ChatGPT 將推行 NSFW 模式(成人模式) , 在目前的 Polaris 上 , 似乎已經看得到苗頭了 。
如果是這樣 , 那 Polaris 是 GPT 5.1 的證據又多一條 , 尤其是考慮到最近 OpenAI 已經在小范圍內做年齡驗證 , 這并非全量行動 , 而是針對不確定實際年齡的用戶做定向推送 。
成人模式的爭議很大 , 實際執行也并不如想象中簡單 , 除了驗證 , 還有隱私信息識別、儲存等一系列麻煩 。 到底能不能有一個平衡多方訴求的解決方案 , 還得看真正的 GPT 5.1 如何應對 。
眼瞧著年底又是一場血戰 , Gemini 3 早就放出風聲(雖然一直跳票) , Nano Banana 2 也突然冒頭 。 更別提前陣子 Kimi K2 Thinking 的發布 , 收獲了海內外一大波關注 , 訓練成本僅為 460 萬美元 。
OpenAI 仍然有著驚人的支出 , 雖然也有著驚人的活躍用戶群 , 但盈利還看不到苗頭 。 在一系列又強又便宜的中國模型的狙擊下 , GPT 5.1 能達到期望嗎?
快知道了 , 網傳 11 月中就將發布 , 到時或許會有答案 。
#歡迎關注愛范兒官方微信公眾號:愛范兒(微信號:ifanr) , 更多精彩內容第一時間為您奉上 。
愛范兒|原文鏈接· ·新浪微博
推薦閱讀
- 晶圓代工巨頭動態:臺積電格芯“牽手”,中芯國際披露并購案進展
- 馬斯克Grok 4深夜大升級:200萬逆天上下文、五倍GPT-5腦容量!
- 離GPT-5最近的一次!中國1萬億參數開源巨獸突然爆火
- 首次跌破5000萬!小米占比僅5.1%無緣第一梯隊!第二名逆風翻盤!
- 旗艦款最高僅5.1GHz,英特爾Panther Lake陣容曝光
- 具身智能何時實現“ChatGPT時刻”,王興興說了個關鍵前提丨聚焦進博會
- OpenAI使用政策更新:ChatGPT被禁止提供專業醫療、法律及財務建議
- 顫抖吧,Bug!OpenAI放出GPT-5「夜行神獸」,命中92%漏洞
- OpenAI首個GPT-5找Bug智能體:全自動讀代碼找漏洞寫修復
- 奧特曼考慮給ChatGPT加廣告了,用8億用戶,救萬億債務
