前谷歌X團隊靠AI電影鎖定戛納！創立AI原生版皮克斯

2025-09-13 17:27 大學生 00后電動自行車

文章圖片

文章圖片

文章圖片

允中發自凹非寺
量子位 | 公眾號 QbitAI
全球首家AI原生影視工作室橫空出世，項目收入竟已高達1.1億美元！
名叫Utopai Studios 。

當前AI熱度如日中天，以AI切入電影行業的力量主要分為兩派：
一派是以Runway、Pika為代表的“工具派” ，聚焦AI的工具屬性，核心發力點在于提升影視制作環節的效率。
另一派則是“內容+AI”公司，其主要在內容的敘事創新與產業化層面推動AI的應用和發行，相當于是把手伸進了影視業最肥沃的利潤區“內容生產+產業落地” 。
這兩類公司的定位，決定了其不同的天花板。
前者更偏向于工具層的效率提升，其特點是，技術門檻高，能不斷迭代生成模型的能力，但商業模式也往往會受限于工具類SaaS的邏輯（即訂閱費、API調用費、B端授權費），最后很可能會成為影視業的“基礎設施型公司” ，或容易被后續更強大的通用模型所取代。
后者定位于創造新敘事形式和發行，這讓其有機會直接切入到包括IP、版權、分發渠道，形成“內容+渠道+AI技術”三位一體的護城河。如若能夠成功突破，天花板將遠遠高于純工具派，因為其有機會改變整個影視業的產業鏈模式，而不僅僅是進行局部的效率提升。
有意思的是， Utopai Studios正是第二類公司。
在Utopai入場之前，該領域幾乎是一片空白，幾乎沒有公司嘗試把AI技術范式與影視內容和產業運作相結合。
而Utopai不僅率先切入了，甚至已經在市場驗證方面跑通了模式，其即將推出的兩個電影項目已經帶來了1.1億美元的收入。

所以，這樣一家公司，到底是什么來頭？
說它“橫空出世” ，其實并不完全準確。該公司實際上創立于2022年，前身為3D生成AI公司Cybever ，早前在硅谷憑借“用AI生成高精度3D虛擬環境”技術就有了一定名氣。
而恰恰是從AI+3D這一起點出發，讓他們看清了更大的愿景：不再只滿足于做技術供應商，而是要轉身直面內容，用AI為傳統影視行業探索新的可能。
轉型Utopai由兩位谷歌系的華裔創始人創立：
聯合創始人兼首席執行官Cecilia Shen ，是標準的00后，孩提時就沉迷于機器人實驗，少年就讀于加拿大滑鐵盧大學，主修數學。大學二年級，進入了谷歌最神秘部門Google X實驗室，參與Moonshot項目。在這里，他遇到了Cybever的另一位聯合創始人Jie Yang 。
聯合創始人兼首席技術官Jie Yang ，曾任Google Research科學家，后加入Alphabet旗下公司任Head of Research 。在AI圖像建模與生成技術領域有深厚的積累，他也是Cybever早期3D引擎架構的主要推動者。
當2022年Cybever剛起步時，團隊的愿景是解決專業3D中長期存在的效率瓶頸問題，而由于3D行業大部分客戶來自影視游戲行業， Cybever主要專注高精度3D虛擬環境的生成，為游戲和影視行業提供場景“地基” 。
但是很快， Cecilia就意識到了“視覺特效”類公司的局限性——利潤非常非常低， Cecilia意識到公司必須往產業鏈的上游走，這樣才能擁有定價權和高利潤的商業模式。
換句話說， Cecilia試圖跳過Runway、Luma等AI工具公司的常規路徑，而選擇直接投身于影視娛樂內容的生產和全球發行，成為AI時代的內容所有者。
接下來發生的故事，與多數速生速死的AI項目不同， Utopai走出了一條極為罕見的、系統性的進化路徑——在從2022-2025年的三年間，兩位創始人用四個階段構建起了AI驅動內容生產的結構性語法，將自己精準卡位在了AI與內容的價值交叉點：
其階段1是：從空間語法邁進“內容永動機” 。
由于Cybever在創立初的架構選擇方面就走了一條不同于同期熱門模型公司如NeRF、3DGS的路，而是選擇了以程序化內容（Procedural Content GenerationPCG）的生成方式，這一策略性的選擇，最終為Utopai奠定了關鍵的基礎，成為了Utopai穩固的底層資產生成能力。
因為PCG的優勢不在于生成力，而在于質量控制、拓撲完整性和工業兼容性。目前， Utopai的系統已經可以自動生成成千上萬個高精度3D資產，并匹配不同光照（晨曦、黃昏、陰影）、相機參數（廣角、長焦）和天氣條件（晴天、雨夜、霧霾）；每個組合都具備了“絕對真值” ，將幾何信息與2D視覺數據緊密綁定，為后續AI理解與生成提供了標準化的輸入空間。
而階段2是指：將“空間智能”編碼為“語法規則” 。
由于PCG模式擅長物體的隨機擺放，但弱點是：當生成對象變成如城市街區或室內空間這樣來自于功能邏輯與空間秩序的空間時，會發生問題。
這讓Cecilia意識到，必須讓AI模型構建起一種“結構性”的能力，也就是“空間語法” 。在這個階段，通過持續的訓練與場景建模，其AI模型開始理解空間中的隱性規則，因為AI不僅能生成，還能思考，這使其不僅能夠還原真實世界的視覺邏輯，更能模擬人類在空間中的行為預期。而該能力，也讓Utopai在生成內容方面具備了前所未有的結構美感和功能的合理性。
而到了階段3 ， AI Agent上場了。在這個階段， Utopai進一步開發了AI Agent系統。
這是一位具備設計直覺的AI創意總監，可以說，該Agent系統不再僅僅響應關鍵詞命令，而是能夠理解模糊、抽象、充滿情緒色彩的創作指令。
例如，當創作者輸入“我想要一條雨夜中的東方小巷，帶點賽博朋克風，像偵探電影那種孤獨感”時， Agent不會停留在風格濾鏡的理解上，而是能生成一個“具備意圖的世界” 。如：墻上的剝落中文海報、水洼中倒映的霓虹、繚繞在空氣中的濕氣——而這些，都是從未被直接要求的細節。
而更加重要的是，由該Agent這一過程輸出的并非是靈感草圖，而是完整的3D預覽資產（Pre-viz），這為影視制作直接節省了數十小時乃至數萬元的人力與渲染成本。
而到了階段4 ，也就是今年上半年，就是Utopai從工具型公司到商業閉環的關鍵一躍了。
在這個階段， Utopai完成了Previz-to-Video的工業閉環。
簡單講， Utopai將以上四階段的能力，全部匯聚成了一個完整的視頻制作工作流——“Previz-to-Video Pipeline” ，并最終破解了當下AI生成視頻方面最大的三大難題：一致性、可控性與敘事延續性。
也就是說，以后導演們就不再需要等待數日，而只需幾分鐘就可以預覽接近成片質量的鏡頭，甚至可以實現“即興拍攝式”創作迭代。這絕不僅僅是一次效率革命，更是內容實驗能力的質變。
夢想和底氣那么，到底Utopai是如何破解目前AI視頻生成領域的“一致性”、“可控性”和”敘事延續性”這三大技術難題的呢？
這個問題很重要，是因為目前AI視頻生成雖已能做出驚艷的畫面，但要真正進入電影、電視劇等工業化場景，提供這三大難題的解決方案繞不過去。
首先，在近期的采訪中， Cecilia就一針見血地指出了目前AI通用模型的最大問題。她指出：
現階段，通用視頻模型都是為服務大眾，核心目標之一是優化效率，讓大眾用戶能以最快速度獲得“足夠好”的結果，這不僅限于影視。但這往往是以犧牲畫面質量為代價。
而也正因為這個原因， Utopai在模型這一關鍵問題上， Cecilia是這么回答的：
簡單講， Utopai的模型只是為了那些對質量有極致追求的專業影視創作者服務，這個群體愿意為更好的效果等待更長的時間。而由于有這種明確定位，也讓Utopai擺脫了效率上的束縛，可以在訓練模型時減少壓縮比例，增加特定方向的訓練數據，采用更多更強的注意力編碼機制，訓練出更大、更好、更專注的模型，將所有算力資源都投入到了對影像質量的打磨上，確保每一幀都經得起大銀幕的考驗。
其次，困擾AI視頻生成領域的所謂“一致性”問題是指：生成視頻難以保證人物外貌、動作和場景元素在不同的鏡頭中保持一致，會導致角色與環境出現“漂移”的情況。
例如Veo3、Runway等在逐幀生成時易出現人臉、服裝、光線甚至環境細節的“漂移” ，比方說主角第一秒時還戴著眼鏡，下一秒眼鏡就沒了。
“這在復雜場景中是目前所有模型的噩夢”Cecilia說。例如當多個角色同時運動和互動、且鏡頭也在不停運動時，現有的模型普遍無法處理好，時常會出現角色互粘、合并，或是動作違背物理規律的幻覺。
Cecilia指出：“我們認為這兩個問題的根源，其實都在于模型對于三維世界的理解是缺失的。由于視頻的本質是2D的，這就導致多數的模型只是在2D平面上對像素進行模仿和壓縮。 ”
而這也正是出身于高精尖3D的Utopai模型的特殊之處——由于Utopai在其模型的訓練過程中，會將帶有物理規律的3D數據注入，讓模型不再是學習2D畫面的表象，這從根本上提升了模型對空間、遮擋、碰撞的認知，避免了產生與物理世界不一致的幻覺問題。 “因為我們做了很久的AI生成高精3D環境，所以這一塊其實是我們的DNA”Cecilia說。

就是所謂的“可控性” 。這一難題是指：用戶能否像導演一樣，精確地控制生成結果，如角色的表情、動作路徑、鏡頭角度、節奏等。
由于目前AI視頻生成大多依賴于“Prompt+隨機采樣” ，所以具有一定的隨機性。這方面，用戶可以輸入“大方向” ，但要控制微觀細節（如讓角色轉頭45度、走到某個位置）非常難。而缺乏可控性，就意味著創作者很難把AI視頻當作是“可預測的生產工具” ，只能作為“靈感生成器” 。
Cecilia指出了這個問題與工作流的相關性， “目前，行業普遍的創作流程都依賴大量的‘抽卡’ ，即反復生成海量內容，然后從中選出少數接近創意的結果。但這在專業制作中是不可接受的，因為導演對每個畫面都有像素級的精確要求，從廣場布局到水杯的位置，從光線強弱到角色眼神的角度。而在“抽卡”的模式下，往往是鏡頭里這個元素符合了，另一個又偏離了，創作過程充滿了隨機性和挫敗感” 。
針對于此， Utopai的解法是：用確定地執行導演的意圖，來取代隨機生成加挑選。
據Cecilia介紹， Utopai工作流允許導演先通過故事板、3DPreviz等方式來快速準確地描繪出一個清晰的草稿。這一草稿不僅是視覺參考，更包含了導演核心意圖的結構化指令。隨后， Utopai的模型與工作流會準確地理解該意圖，并結合影片整體的藝術風格，自動、有方向性地朝著最終目標進行嘗試和調整。這恰恰是強化學習和智能Agent等技術擅長的地方。
這或許也正是Utopai與其他許多“技術顛覆論”者最根本的區別，因為其系統設計的核心不是要取代導演和藝術家。恰恰相反，其系統的核心是要將導演和藝術家們從工業的枷鎖中解放出來，讓他們回歸到創意王座。
而這也代表了Cecilia很強的審美傾向。 Cecilia表示， AI可以生成無窮選項，但定義品味的永遠是會講故事和有藝術審美的人。 Utopai更深遠的意義在于，其系統設計追求的是人與AI之間形成一種共生進化的關系。
為此， Cecilia設定了Utopai的北極星，那就是：要做一個個性化的、端到端的影視制作AI架構。通過其高度整合的AI模型與自動化工作流，將電影和內容的制作成本大幅降低，從而將成千上萬的電影人從“預算”的枷鎖中解放，讓他們能夠以前所未有的速度和極低成本，將劇本中的故事變為高質量的影像作品。并且，這一切都不以犧牲質量為代價。
而從公司內部而言，那就是，構建起一個數據、模型與工作流的“軟硬一體”的架構。
Cecilia指出，現在AI影視的一個普遍問題是，模型與工作流被視為兩個獨立環節，彼此割裂。一方面，模型公司負責提升算法，另一方面，制作公司只關注流程優化，兩者缺乏深度的協同進化。
與此同時， Cecilia還強調了內容質量的重要意義。她認為，質量一定是優先的。
觀眾的眼睛就是尺子。有時，人們低估了細節帶來的影響。其實我們發現，每一個藝術家或創造者都像孩子一樣，他們并不是抵觸技術。一個例子是：1995年上映的《玩具總動員》，這是世界上首部數字制作的動畫長片，無論在創意還是技術上，都是一次影響深遠的躍進，并且在全球斬獲了近4億美元的票房收入。那么，所謂的AI被抵觸是否是因為我們用AI的方式錯了？
而這就又回到了細節和質量的問題，科技為打造更高質量的產品創造條件，而消費者，并不會因為AI就愿意降低對質量和故事的追求。
優勢最后一個問題是：那么，到底Utopai要實現這一北極星有什么優勢呢？
首先， Utopai已經創收1.1億美元，就是其具有優勢的一個明證，因為這在公司戰略上說明了Utopai已經打通好萊塢的內容與生態鏈。
為做到這一點，首先， Utopai甩出了是兩張影視界王牌：
一張是被好萊塢稱為“史上最難拍史詩巨作”、素來是好萊塢呼聲最高、但一直排名未拍攝電影前10的《科爾特斯》（Cortés）。這部電影之所以難拍，是因為它用傳統電影制作的方式成本太高太高，但手握技術并不懼怕的Utopai為其邀請來了奧斯卡提名編劇Nicholas Kazan執筆，并邀請了好萊塢名列49的概念設計師Kirk Petruccelli來執導。

另一張王牌，則是被普遍形容為是“當《壯志凌云》遇見《世界大戰》 ”的八集科幻劇集《太空計劃》（Project Space）。這同樣是大手筆， Utopai為其邀請來了著名編劇Vanessa Coifman和Martin Weisz執筆、并請了Martin Weisz來執導。該劇目前已經成功預售歐洲市場。

“在好萊塢要做AI原生影視，起點就一定要高，手段一定要新”Cecilia說。
此外，為了發行該項目， Utopai還與《與狼共舞》及《地平線：美國傳奇》的銷售公司K5 International成立了一家合資公司。后者將于今年秋季在MIPCOM和AFM上代理所有Utopai的項目。 Utopai還與以《權力的游戲》和《美國隊長》聞名的可視化公司OPSIS合作，將其流程整合到電影制作人友好的工作流程中。
需要注意的是，這兩部劇為Utopai在全球創造了約1.1億美元的收入。而這一數字是其他AI工作室無法比擬的，并且也讓Utopai一炮而紅，在其首部電影上映前， Utopai已躋身于好萊塢一線大制作的行列。
此外，所有的GenAI公司都覬覦于好萊塢人脈，但至今沒有公司宣布類似計劃。如Aesteria（現已被Moonvalley AI收購）最近宣布將制作《恐怖谷》，或Runway和Luma也都大力宣傳其好萊塢人脈，但在電影內容AI領域，尚無公司宣布類似計劃。
殊不知早在今年4月底， Utopai的故事就被搬上了著名雜志《福布斯》。而剛《福布斯》在今年8月又獨家報道了他們的故事，并稱其道：“Utopai的故事，標志著AI公司在媒體領域定位的轉變。他們并不打算向工作室系統出售模型或API ，而認為真正的價值在創造和擁有知識產權。這種模式，與皮克斯曾經將其圖形工具轉變為敘事引擎的做法如出一轍。 ”

當然， Utopai的優勢還包括：其自研的底層模型以及數據。但關于這兩個問題， Cecilia目前并不愿多說。
Utopai正在做的，就是拆掉想象力的柵欄，將電影從“預算的暴政”中解救出來。這不僅僅是技術的升級，更是一場關于創作自由的革命。而這一切才剛剛開始，就讓子彈再飛一會兒吧。
— 完 —
量子位 QbitAI · 頭條號簽約
【前谷歌X團隊靠AI電影鎖定戛納！創立AI原生版皮克斯】關注我們，第一時間獲知前沿科技動態

推薦閱讀

上一篇：小米澎湃OS 3第二批Beta版開啟招募：覆蓋REDMI K80、小米M

下一篇：蘋果iPhone 17系列支持電荷泵+AVS快充：實際峰值能到60W