一個全新的世界模型，終于讓AI視頻進入了“無限流”時代。

2026-04-18 華為mate 70 ai 華為鴻蒙系統

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

昨晚夜里快12點， AI視頻公司PixVerse毫無預兆的發了一個項目。
PixVerse R1 ，下一代實時世界生成模型。
這玩意你看文字，可能不是很好理解，我直接放一個官方的demo視頻，大家的感覺應該會強一些。

上面是視頻，下面是實時輸入的Prompt 。
整個過程，都是AI一直連續不斷的生成視頻，你可以在過程中用Prompt修改視頻的進程，比如開頭第一句Promtp ，是士兵躺在雪山上，然后躺著躺著，你就輸入了一個Prompt ，說一只黑烏鴉飛過，飛完了以后，這個視頻準備自己去做一些決策了自己去演后續的劇情了，你又有了新想法，于是，你又發了一段Prompt過去：
巡邏隊發現了士兵。
每次你輸入Prompt延遲2秒左右之后，你會發現，這個世界的劇情，就隨著你的不斷輸入，不斷的進行變化。
如果你不給Prompt干涉的話，他會自己一直演下去，最長的時間，在官方的技術報告里，寫的是：
無限、連續的視覺流式傳輸。
PixVerse將其稱為，實時世界生成模型。
網址在此：https://pixverse.ai/en/blog/pixverse-r1-next-generation-real-time-world-model
項目報告我也看了一下。
還是蠻有意思的。
但是在實際給大家看這個項目之前，我覺得還是需要我們先統一一下，大家對于世界模型的定義，這樣才更好去聊。
畢竟，世界模型這個詞，這一兩年，出現的太多了，以至于大家，好像完全不知道世界模型到底指向的是什么了。
我心中的世界模型，因為這一波23年到25年的生成式浪潮，所以其實是一個非常泛的定義：
能用一個可持續的內部狀態，去預測世界接下來會怎樣變化，并且能被交互和驗證。
這也是為什么同一個詞，經常會同時被拿來形容三類東西：
視頻生成模型、可交互的生成世界、面向機器人和自動駕駛的物理仿真基礎模型。
只要滿足這個條件的，在目前的大眾語境里，都可以被統稱為，世界模型。
目前已有的世界模型代表，基本可以用幾個項目，代表3個方向：
1. Google的Genie 3和Odyssey 。
以Genie 3舉例子。
我之前也寫過文章：
大概就是給一個文本提示，就能生成你可以實時導航的動態世界， 24fps ， 720p ，一致性可以維持到分鐘級。

我極度極度看好世界模型，之前也極度的看好Genie的項目，我曾經甚至說，沒有把Genie 3寫火，讓很多人關注到這個項目，是我們這些做AI內容的不專業和失職。
它代表的，是一次生成，然后可以在里面操控方向進行簡單交互的視頻類動態世界模型。
2. 李飛飛World Labs的Marble和混元3D世界模型。
以Marble舉例子。
一個以三維空間智能為中心的多模態世界模型，
World Labs給Marble的定義重點在3D ，世界模型需要重建、生成、模擬三維世界，同時允許人和智能體在其中交互，這類路線的核心難點變成3D 表示和空間一致性，視頻畫面只是表層輸出。
它代表的，是一次生成，然后可以在里面進行簡單交互的3D類世界模型。
3. 英偉達Cosmos 。
一個非常純粹的，為物理AI服務的世界基礎模型平臺。
Cosmos的定位是面向自動駕駛、機器人、視頻分析agent的WFM平臺，強調數據處理、tokenizer、guardrails 和把世界模型用于高保真、物理相關的合成數據與后訓練。
這條路線的評價標準更偏物理正確性、可控性、可用于訓練與驗證。
它代表的，是為訓練具身智能和自動駕駛而生的世界模型。
這幾個方向，基本就是現在世界模型方向的主流。
現在，相信大家也對世界模型，有了基本的差異化了解了，其他這玩意還是比較泛的，并沒有一個特別明確的定義，路線又挺多，場景也挺多。
而這次， PixVerse的這個新的項目，為世界模型，補上了第四個方向，也是我自己過去一直期待的方向。
實時視頻生成。
他們也上線了一個可以實測的demo版本可以玩。
網址在此：https://realtime.pixverse.ai/
里面已經給了6個預設的模板，感覺后面還會更新更多。
我點了一下，發現，要邀請碼。
我就跑去問PixVerse的朋友，問他們為啥這年頭了還要搞邀請碼這事。
他們是這么說的：
不過我還是舔著老臉，深夜要了一個邀請碼過來。
實際去體驗了一下。
這個體驗的結果，我說實話，可能是我最近，體驗的最快樂的產品了。
你們看完就知道，為啥快樂了。。。
拿到邀請碼進去以后，我先隨手點了最后一個那個卡通的模板。
在頁面上，你就會發現，有一個倒計時，大概意思就是，你只能在這個live里，體驗五分鐘，體驗五分鐘之后，就得新起一個窗口重來了。
核心原因，還是這玩意太燒算力了。
我點了進去。
一進去，這魔性的音樂，噔噔噔噔噔的，差點給我洗腦了。。。
然后，一雙腳，就開始瞪著跑起來了。
我一定要給你們看看這個抽象的畫面，我真的，凌晨2點多，在家里笑的嘎嘎的。

說實話，我硬生生看著小人跑了2分鐘，我愣是一句話沒發出去。。。
因為實在是太歡樂了，我就一直看著它跑，跑著跑著2分鐘過去了，我都忘了我是可以隨時更改劇情的。。。
然后，我又點開了他們那個1944的模板，瘋狂的開始互動，這一次，我在家里笑出了豬叫，特別是最后，我讓它從黑洞中穿梭，盡頭是卡皮巴拉的時候。
我感覺我的大腦褶皺都撫平了。

真的，非常坦率的講， PixVerse R1作為一個實驗性的全新物種，在生成質量上，肯定還是有很強的進步空間的。
但是，作為一個全新的物種，它的實時生成，他的隨時可交互。
這個快樂，如果不親身體驗一下的話，你是絕對感受不到的。
那是一種，你完全未知的快樂，但是你就是期待著，下一秒，他會發生什么。
你就是會期待著，你的那句話，會對這個屏幕里的小人，產生什么樣的影響。
還有這個賽博朋克，也很好玩。

真的，我們看了太多太多套路話的故事，那種千篇一律沒有新意的故事，這種實時生成的AI ，由AI所造出的世界。
好像，會更讓我驚喜，會更讓我期待。
更別提，我還能用嘴，來指揮后續的動作了。
這里我強烈建議大家使用這個語音模式。
相信我，你在玩的時候的卡點，可能是是打字速度跟不上你想要的劇情速度。
【一個全新的世界模型，終于讓AI視頻進入了“無限流”時代。】除了這些預設好的模板之外。
你當然，也可以去自定義。
第一個想到的demo ，其實就是一個我還滿喜歡的游戲，無人深空，因為這個游戲，跟實時生成實在太契合了。
我直接直接發了個起始Prompt過去：
這是一個正在運行的科幻探索類游戲畫面，不是被攝像機拍攝的影像。
畫面以穩定的游戲視角呈現，不存在攝影機跟隨、推拉或電影化運鏡。世界由程序生成并持續運行，角色只是世界中的一部分，畫面變化來自世界狀態的演化。
然后，這個探索，就開始了。

非常的酷非常的有意思。
還有，街霸PK 。

真的，太好玩了。
好久沒有用AI ，這么純粹的快樂了。
我非常開心，能見到我們未來的娛樂形態，可能又會多一種非常好玩的方式。
也許再過幾年，所謂的電影、綜藝、游戲，根本就不再是固定時長的文件，而是一條條永遠流動著的世界時間線。
創作者給一個起點，給一些世界觀設定，剩下的交給世界模型自己往前長，觀眾進來以后，用一句話、一個表情、一次選擇，把劇情輕輕拽偏一點。
所有人看到的，都是同一個宇宙，但卻是不同的一條時間支線。
雖然讓人人創造內容，是一種奢望。
但，在人的本源里，我覺得，每個人還是享受，創造的樂趣的。
這一天。
可能是AI模型歷史上，會標紅的一頁。
很新，很有趣，但同時。
也很未來。
以上，既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉發三連吧，如果想第一時間收到推送，也可以給我個星標?～謝謝你看我的文章，我們，下次再見。
/ 作者：卡茲克
/ 投稿或爆料，請聯系郵箱：wzglyay@virxact.com

推薦閱讀

上一篇：開發周期緊張影響升級？消息稱三星S26+屏幕尺寸與前代保持一致

下一篇：曝蘋果新款 MacBook Pro 或本月發布