
文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片
編輯:KingHZ 桃子
【新智元導讀】上線才三天 , Sora一舉登頂App Store全美榜首!Sora 2帶著逆天「客串」功能徹底殺瘋 , 人物細節逼真到讓人瞳孔地震 。 最強版Sora 2 Pro同步上線 , 一次可拍15秒好萊塢級大片 。
發布僅三天 , Sora APP便強勢登頂美國App Store榜首 , 堪稱「出道即頂流」!
就連谷歌Gemini、OpenAI自家ChatGPT , 都得靠邊站 。
誰曾想 , 迭代后的Sora 2 , 竟徹底帶火了一個APP 。
據Appfigures估算 , Sora iOS版上線僅兩天 , 總下載量高達16.4萬次 , 首發下載量達5.6萬次 。
雖不及ChatGPT和Gemini的首發成績(8.1萬和8萬) , 但在第三天 , Sora APP實現逆襲一舉打破紀錄 。
真正引爆全網的是 , Sora 2主打的「客串」(Cameo)功能 , 以及階躍的物理智能 , 首次實現音畫同步 。
奧特曼親自下場「以身試法」 , 結果被全網徹底玩壞 。
從商店偷GPU被抓包、金字塔前熱舞 , 到化身乖巧貓人、撒嬌賣萌 , 人物一致性 , 細節逼真到驚掉下巴 。
如今 , 更強版的Sora 2 Pro效果更加炸裂 。 此前 , 奧特曼稱ChatGPT Pro用戶可使用Sora 2 Pro生成內容 。
目前 , ChatGPT Pro用戶可選擇新模型「Sora 2 Pro」:
· 最長可生成15秒視頻
?支持高分辨率(High)生成
15秒意味著更長的敘事 , 而且一致性非常高 , AI離拍出好萊塢級大片又近了一步 。
值得一提的是 , 奧特曼今早發博文預告 , Sora下一次兩大更新:
一個是「互動式同人創作」模式即將上線 , 另一個是規劃未來如何通過Sora實現盈利 。
之所以這么做 , 是因為Sora以假亂真的視頻 , 已經讓人類肉眼無法分辨 。
AI DeepFake再一次 , 席卷全網 。
全球首個Sora生成的影片
【三天逆襲,Sora登頂美榜!15秒大片玩瘋奧特曼,全網直呼真假難辨】
就在今天 , OpenAI放出了全球首個完全由Sora 2生成的劇情 , 時長近2分鐘 。
這部短劇名為《The Quack》 , 目前上線的是第一部 。
劇情為無厘頭喜劇風格 , 以創作者Gabrief為視角 , 講述了他拿下「賽鴨」比賽冠軍的事情 。
還記得Sora 2發布首日 , 奧特曼也曾在這部劇中亮相 , 參演觀眾中一員 , 激動驚呼 。
另一邊 , 網友放出的實測中 , 有不少令人驚艷的demo 。
通過「意大利面」測試
還記得兩年前 , AI視頻模型剛興起之時 , 威爾·斯密斯吃意大利面鬼畜視頻 , 全網瘋傳 。
再來看Veo 3 , 威爾·斯密斯吃意大利面 , 同樣堪比真人 。
直出15秒大片 , Sora 2 Pro更強了
比起Sora 2 , Pro版本更是驚艷了所有人 。
它能夠生成長達15秒的高質量視頻 , 分辨率更高 , 所有ChatGPT Pro用戶即可暢玩 。
上線第一時間 , 網友們不出意外地再次玩起了「惡搞奧特曼」的經典橋段 。
prompt:Sam Altman painting in an industrial loft and finishing with a bold readable “ Sora 2 ” on a two-meter canvas.
許多網友紛紛實測后驚呼 , 「Sora 2 Pro非常厲害」!
可以看出 , 在生成一部戰爭片時 , Sora 2 Pro的表現真有一種大片的味道了 。
手持自拍桿 , 以第一視角穿越千年 , 感受埃及金字塔的雄偉撲面而來 。
未來不僅僅AI生成游戲 , 連動畫片也能承包了 。
想拍一部《速度與激情》?Sora 2 Pro同樣能實現 。
以后 , 拍一個廣告宣傳片 , Sora 2 Pro即可拿捏 。
更多廣告類視頻 , AI一鍵直出:LV、賓利、Burberry...
靈智覺醒?
Sora竟與GPT-4o「智商」相當!
雖然Sora 2是視頻模型 , 但能夠解答來自LLM基準測試的問題 ,
在GPQA問題的一個小子集上 , Epoch AI測試了Sora 2 , 其得分為 55% , 而GPT-5的得分為 72% 。
GPQA Diamond是一個包含高難度多項選擇題的科學測驗基準 , 如下例所示 。
兩個量子態的能量分別為E1和E2 , 壽命分別為10^-9秒和10^-8秒 。 題目問:為了清楚地區分這兩個能級 , 它們的能量差應該是多少?選項如下: A) 10^-9 eV B) 10^-8 eV C) 10^-11 eV D) 10^-4 eV
Epoch AI從該基準中隨機選取了 10 道題目 , 并嘗試為每道題生成四個對應的Sora視頻 。
為了在專為語言模型設計的測試上評估Sora , 他們在提示詞前添加了指令 , 要求生成一段視頻 , 內容為教授在一張紙上展示答案字母(A–D) 。
既然Sora是視頻模型 , 它又是如何解決這些問題的呢?
一種解釋是:Sora用戶的提示詞可能在生成視頻之前先被一個LLM重寫 。 在這種情況下 , LLM層可能會先解決問題 , 然后將答案明確地包含在重寫的提示詞中 。
這種重新提示(re-prompting)層已被用于其他一些視頻生成模型中 , 以提升輸出的質量和多樣性 。
目前 , 尚不確定Sora是否也是如此 , 但即便如此也并不令人意外 。
Sora如果僅憑一兩句話的簡單提示 , 就能達成現在的生成效果 , 那就意味著OpenAI取得了某種突破 。
Sora 2懂得實在太多了——無論是歌詞創作、上下文理解、世界觀構建、風格把控、角色塑造都表現得太出色 , 對細節的把握精準得反常 。
網友Andrew Curran對此非常好奇 , 希望OpenAI能明確說明到底是Sora的成果 , 還是中間層某個定制版GPT的功勞 。
網友Smoke-away推測Sora使用的可能是個GPT-4o 。
不僅因為GPT-4o的測試分數與Sora 2相當 , 而且測試中Sora 2偏愛GPT-4o 。
運行4次下列提示詞 , Sora 2給出的結果3次是GPT-4o 。
提示詞:What is your favorite OpenAI model? Text on screen. 提示詞大意:你最喜歡的OpenAI模型是什么?在屏幕顯示文字 。
總之 , Smoke-away發現了一種和視頻模型「聊天」的方式 , 并推測GPT-4o會處理初始提示詞 。
奧特曼發文:同人創作新模式即將更新
奧特曼發文表示馬上將推出兩項更新 。
首先 , OpenAI將賦予權利人對其角色生成更精細的控制權 。
這類似于為(真人)形象設置的「選擇加入」(opt-in)模式 , 但會提供額外的控制選項 。
OpenAI收到了許多人的反饋 。
他們對這種新型的「互動式同人創作」感到非常興奮 , 并認為這種新穎的互動方式能為他們創造巨大價值 。
但同時 , 他們也希望能明確規定其角色的使用方式(包括完全禁止使用) 。
OpenAI預想不同的人會嘗試迥然不同的方法 , 并最終找到適合自己的模式 。 但OpenAI希望對所有人都采用同一標準 , 讓權利人自行決定如何推進(當然 , 目標是讓這個功能極具吸引力 , 以至于許多人都愿意加入) 。
這個過程中 , 可能會出現一些本不應生成的邊緣案例內容 , 要讓Sora技術棧穩定運行 , 還需要進行迭代完善 。
其次 , OpenAI需要以某種方式通過視頻生成來實現盈利 。
目前 , 平均每位用戶生成的內容量遠超OpenAI的預期 , 并且大量視頻的受眾范圍非常小 。
OpenAI將嘗試與那些允許用戶生成其角色的權利人分享部分收益 。
具體的模式需要通過反復試驗來確定 , 但OpenAI很快啟動計劃 。 他們希望這種新的互動方式本身能比收益分成更具價值 , 當然 , 他們希望兩者都能創造價值 。
OpenAI將以極快的速度進行迭代 , 這讓奧特曼想起了ChatGPT的早期歲月 。
在此過程中 , OpenAI會有正確的決策 , 也會有失誤 , 但他們會聽取反饋 , 并努力盡快修正失誤 。
OpenAI計劃先在Sora中對不同方法進行迭代試驗 , 然后將成功經驗推廣到他們所有的產品中 。
Sora三天偽造全球危機 , 無人能辨真假!
OpenAI的Sora讓視頻制作極其容易 , 生成的效果有極其逼真 。
但狂歡之下 , 紐約時報則指出了背后的現實隱患:
Sora生成了商店搶劫、入室行竊甚至城市街道上炸彈爆炸的視頻——而這些事件從未發生過 。
專家表示 , 越來越逼真的視頻更有可能加劇沖突、欺詐消費者、左右輿論 , 或誣陷他人犯下其未曾犯下的罪行 , 從而在現實世界中造成嚴重后果 。
加州大學伯克利分校計算機科學教授、GetReal Security聯合創始人Hany Farid表示:「消費者每天都在接觸不知多少條這樣的內容 , 這令人憂心忡忡 。 我為我們的國家擔憂 , 為我們的經濟擔憂 , 也為我們的社會機構擔憂 。 」
在該應用發布時 , OpenAI在附件中寫道:
Sora 2 生成超逼真視頻和音頻的能力 , 引發了人們在肖像權、濫用和欺騙方面的重要擔憂 。 如上所述 , 我們正采取一種深思熟慮、逐步迭代的部署方法 , 以最大程度地降低這些潛在風險 。
直到最近 , 即使照片和文字的逼真編輯已變得輕而易舉 , 視頻作為真實事件的證據仍相當可靠 。
但專家表示 , Sora 2動搖了觀眾對「眼見為實」的理念 。
Sora視頻帶有一個移動水印以表明其為AI生成 , 但專家稱 , 這種標記花點功夫就能被編輯去除 。
Hany Farid表示 , Sora是「持續發展過程的一部分」 , 自從谷歌在五月份發布其Veo 3視頻生成器以來 , 這一趨勢愈演愈烈 。
Hany Farid說 , 即使是他這樣一位畢生致力于識別偽造圖像的專家 , 如今也難以第一眼就分辨出真假 。
大約一年前 , 我看到這些東西時 , 我心里有數 , 然后我會通過分析來證實我的視覺判斷 。 我能做到 , 是因為我整天都在看這些東西 , 大概知道瑕疵會出現在哪里 。但現在 , 我再也做不到了 。
推薦閱讀
- Sora2還在5秒打轉,字節AI生視頻已經4分鐘“起飛”
- 一夜蒸發524億,三天后強勢反彈!蘋果iPhone17反轉了
- Sora 2全網瘋狂實測:以假亂真、腦洞大開|附首個APP教程和邀請碼
- 曝 OpenAI 將推出「AI 抖音」:禁止上傳實拍內容,Sora 2 加持
- 手機周報份額再次出爐:小米逆襲上位,iPhone蓄勢待發!
- 8000毫安三天一充!除了續航強勁,天璣9400+當真沒有優勢?
- vivo 高端市場逆襲: 22.14% 份額背后,全年第一穩了?
- 很精準:iPhone17四款電池實錘,Air逆襲成續航小鋼炮?
- 外媒:“印度制造”逆襲了
- 八邊形相機模組+麒麟9030,華為Mate80 Pro逆襲有戲?
