三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨

文章圖片

編輯:KingHZ 桃子
【新智元導讀】上線才三天 , Sora一舉登頂App Store全美榜首!Sora 2帶著逆天「客串」功能徹底殺瘋 , 人物細節逼真到讓人瞳孔地震 。 最強版Sora 2 Pro同步上線 , 一次可拍15秒好萊塢級大片 。




發布僅三天 , Sora APP便強勢登頂美國App Store榜首 , 堪稱「出道即頂流」!
就連谷歌Gemini、OpenAI自家ChatGPT , 都得靠邊站 。

誰曾想 , 迭代后的Sora 2 , 竟徹底帶火了一個APP 。
據Appfigures估算 , Sora iOS版上線僅兩天 , 總下載量高達16.4萬次 , 首發下載量達5.6萬次 。
雖不及ChatGPT和Gemini的首發成績(8.1萬和8萬) , 但在第三天 , Sora APP實現逆襲一舉打破紀錄 。

真正引爆全網的是 , Sora 2主打的「客串」(Cameo)功能 , 以及階躍的物理智能 , 首次實現音畫同步 。
奧特曼親自下場「以身試法」 , 結果被全網徹底玩壞 。
從商店偷GPU被抓包、金字塔前熱舞 , 到化身乖巧貓人、撒嬌賣萌 , 人物一致性 , 細節逼真到驚掉下巴 。







如今 , 更強版的Sora 2 Pro效果更加炸裂 。 此前 , 奧特曼稱ChatGPT Pro用戶可使用Sora 2 Pro生成內容 。

目前 , ChatGPT Pro用戶可選擇新模型「Sora 2 Pro」:
· 最長可生成15秒視頻
?支持高分辨率(High)生成



15秒意味著更長的敘事 , 而且一致性非常高 , AI離拍出好萊塢級大片又近了一步 。
值得一提的是 , 奧特曼今早發博文預告 , Sora下一次兩大更新:
一個是「互動式同人創作」模式即將上線 , 另一個是規劃未來如何通過Sora實現盈利 。



之所以這么做 , 是因為Sora以假亂真的視頻 , 已經讓人類肉眼無法分辨 。

AI DeepFake再一次 , 席卷全網 。


全球首個Sora生成的影片
【三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨】

就在今天 , OpenAI放出了全球首個完全由Sora 2生成的劇情 , 時長近2分鐘 。

這部短劇名為《The Quack》 , 目前上線的是第一部 。
劇情為無厘頭喜劇風格 , 以創作者Gabrief為視角 , 講述了他拿下「賽鴨」比賽冠軍的事情 。
還記得Sora 2發布首日 , 奧特曼也曾在這部劇中亮相 , 參演觀眾中一員 , 激動驚呼 。

另一邊 , 網友放出的實測中 , 有不少令人驚艷的demo 。
通過「意大利面」測試
還記得兩年前 , AI視頻模型剛興起之時 , 威爾·斯密斯吃意大利面鬼畜視頻 , 全網瘋傳 。



再來看Veo 3 , 威爾·斯密斯吃意大利面 , 同樣堪比真人 。



直出15秒大片 , Sora 2 Pro更強了


比起Sora 2 , Pro版本更是驚艷了所有人 。
它能夠生成長達15秒的高質量視頻 , 分辨率更高 , 所有ChatGPT Pro用戶即可暢玩 。
上線第一時間 , 網友們不出意外地再次玩起了「惡搞奧特曼」的經典橋段 。

prompt:Sam Altman painting in an industrial loft and finishing with a bold readable “ Sora 2 ” on a two-meter canvas.



許多網友紛紛實測后驚呼 , 「Sora 2 Pro非常厲害」!
可以看出 , 在生成一部戰爭片時 , Sora 2 Pro的表現真有一種大片的味道了 。


手持自拍桿 , 以第一視角穿越千年 , 感受埃及金字塔的雄偉撲面而來 。

未來不僅僅AI生成游戲 , 連動畫片也能承包了 。

想拍一部《速度與激情》?Sora 2 Pro同樣能實現 。
以后 , 拍一個廣告宣傳片 , Sora 2 Pro即可拿捏 。

更多廣告類視頻 , AI一鍵直出:LV、賓利、Burberry...








靈智覺醒?
Sora竟與GPT-4o「智商」相當!


雖然Sora 2是視頻模型 , 但能夠解答來自LLM基準測試的問題 ,
在GPQA問題的一個小子集上 , Epoch AI測試了Sora 2 , 其得分為 55% , 而GPT-5的得分為 72% 。

GPQA Diamond是一個包含高難度多項選擇題的科學測驗基準 , 如下例所示 。

兩個量子態的能量分別為E1和E2 , 壽命分別為10^-9秒和10^-8秒 。 題目問:為了清楚地區分這兩個能級 , 它們的能量差應該是多少?選項如下: A) 10^-9 eV B) 10^-8 eV C) 10^-11 eV D) 10^-4 eV


Epoch AI從該基準中隨機選取了 10 道題目 , 并嘗試為每道題生成四個對應的Sora視頻 。
為了在專為語言模型設計的測試上評估Sora , 他們在提示詞前添加了指令 , 要求生成一段視頻 , 內容為教授在一張紙上展示答案字母(A–D) 。
既然Sora是視頻模型 , 它又是如何解決這些問題的呢?
一種解釋是:Sora用戶的提示詞可能在生成視頻之前先被一個LLM重寫 。 在這種情況下 , LLM層可能會先解決問題 , 然后將答案明確地包含在重寫的提示詞中 。
這種重新提示(re-prompting)層已被用于其他一些視頻生成模型中 , 以提升輸出的質量和多樣性 。
目前 , 尚不確定Sora是否也是如此 , 但即便如此也并不令人意外 。
Sora如果僅憑一兩句話的簡單提示 , 就能達成現在的生成效果 , 那就意味著OpenAI取得了某種突破 。
Sora 2懂得實在太多了——無論是歌詞創作、上下文理解、世界觀構建、風格把控、角色塑造都表現得太出色 , 對細節的把握精準得反常 。
網友Andrew Curran對此非常好奇 , 希望OpenAI能明確說明到底是Sora的成果 , 還是中間層某個定制版GPT的功勞 。

網友Smoke-away推測Sora使用的可能是個GPT-4o 。
不僅因為GPT-4o的測試分數與Sora 2相當 , 而且測試中Sora 2偏愛GPT-4o 。
運行4次下列提示詞 , Sora 2給出的結果3次是GPT-4o 。
提示詞:What is your favorite OpenAI model? Text on screen. 提示詞大意:你最喜歡的OpenAI模型是什么?在屏幕顯示文字 。



總之 , Smoke-away發現了一種和視頻模型「聊天」的方式 , 并推測GPT-4o會處理初始提示詞 。



奧特曼發文:同人創作新模式即將更新


奧特曼發文表示馬上將推出兩項更新 。
首先 , OpenAI將賦予權利人對其角色生成更精細的控制權 。
這類似于為(真人)形象設置的「選擇加入」(opt-in)模式 , 但會提供額外的控制選項 。
OpenAI收到了許多人的反饋 。
他們對這種新型的「互動式同人創作」感到非常興奮 , 并認為這種新穎的互動方式能為他們創造巨大價值 。

但同時 , 他們也希望能明確規定其角色的使用方式(包括完全禁止使用) 。
OpenAI預想不同的人會嘗試迥然不同的方法 , 并最終找到適合自己的模式 。 但OpenAI希望對所有人都采用同一標準 , 讓權利人自行決定如何推進(當然 , 目標是讓這個功能極具吸引力 , 以至于許多人都愿意加入) 。
這個過程中 , 可能會出現一些本不應生成的邊緣案例內容 , 要讓Sora技術棧穩定運行 , 還需要進行迭代完善 。
其次 , OpenAI需要以某種方式通過視頻生成來實現盈利 。
目前 , 平均每位用戶生成的內容量遠超OpenAI的預期 , 并且大量視頻的受眾范圍非常小 。
OpenAI將嘗試與那些允許用戶生成其角色的權利人分享部分收益 。
具體的模式需要通過反復試驗來確定 , 但OpenAI很快啟動計劃 。 他們希望這種新的互動方式本身能比收益分成更具價值 , 當然 , 他們希望兩者都能創造價值 。
OpenAI將以極快的速度進行迭代 , 這讓奧特曼想起了ChatGPT的早期歲月 。
在此過程中 , OpenAI會有正確的決策 , 也會有失誤 , 但他們會聽取反饋 , 并努力盡快修正失誤 。
OpenAI計劃先在Sora中對不同方法進行迭代試驗 , 然后將成功經驗推廣到他們所有的產品中 。


Sora三天偽造全球危機 , 無人能辨真假!


OpenAI的Sora讓視頻制作極其容易 , 生成的效果有極其逼真 。
但狂歡之下 , 紐約時報則指出了背后的現實隱患:
Sora生成了商店搶劫、入室行竊甚至城市街道上炸彈爆炸的視頻——而這些事件從未發生過 。


專家表示 , 越來越逼真的視頻更有可能加劇沖突、欺詐消費者、左右輿論 , 或誣陷他人犯下其未曾犯下的罪行 , 從而在現實世界中造成嚴重后果 。
加州大學伯克利分校計算機科學教授、GetReal Security聯合創始人Hany Farid表示:「消費者每天都在接觸不知多少條這樣的內容 , 這令人憂心忡忡 。 我為我們的國家擔憂 , 為我們的經濟擔憂 , 也為我們的社會機構擔憂 。 」

在該應用發布時 , OpenAI在附件中寫道:
Sora 2 生成超逼真視頻和音頻的能力 , 引發了人們在肖像權、濫用和欺騙方面的重要擔憂 。 如上所述 , 我們正采取一種深思熟慮、逐步迭代的部署方法 , 以最大程度地降低這些潛在風險 。
直到最近 , 即使照片和文字的逼真編輯已變得輕而易舉 , 視頻作為真實事件的證據仍相當可靠 。

但專家表示 , Sora 2動搖了觀眾對「眼見為實」的理念 。
Sora視頻帶有一個移動水印以表明其為AI生成 , 但專家稱 , 這種標記花點功夫就能被編輯去除 。
Hany Farid表示 , Sora是「持續發展過程的一部分」 , 自從谷歌在五月份發布其Veo 3視頻生成器以來 , 這一趨勢愈演愈烈 。
Hany Farid說 , 即使是他這樣一位畢生致力于識別偽造圖像的專家 , 如今也難以第一眼就分辨出真假 。
大約一年前 , 我看到這些東西時 , 我心里有數 , 然后我會通過分析來證實我的視覺判斷 。 我能做到 , 是因為我整天都在看這些東西 , 大概知道瑕疵會出現在哪里 。但現在 , 我再也做不到了 。

    推薦閱讀