剪映前AI產品負責人創業多模態Agent,成立半月融資數百萬美元

剪映前AI產品負責人創業多模態Agent,成立半月融資數百萬美元

文章圖片

剪映前AI產品負責人創業多模態Agent,成立半月融資數百萬美元

文章圖片

剪映前AI產品負責人創業多模態Agent,成立半月融資數百萬美元

文章圖片

剪映前AI產品負責人創業多模態Agent,成立半月融資數百萬美元

文章圖片


衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
生數科技前產品副總裁廖謙創業了 。
在此之前 , 他還先后擔任過字節剪映與火山引擎前AIGC產品負責人 。
8月底從老東家離職后 , 公司成立僅半個月 , 就已經拿下了硅谷美元基金HT Investment與BV百度風投的數百萬美元投資 。
他要做的是一件看起來很“產品人”的事——
打造面向營銷場景的多模態Agent , 同時將逐步構建新時代AI信息表達系統 。
他給公司起名為極致上下文(Apex Context) 。
這個名字來自他對下一階段AI發展的理解:AI應該能深度理解并呼應用戶的上下文 , 讓生成的內容更精準、更貼合預期 。
從人文一點的角度出發 , 他說這個名字背后是極致上下文的公司文化 , 希望它有“更多的Context , 更少的Control” 。

廖謙學計算機視覺技術出身 , 一路打拼 , 創業前最后一份工作的title是“產品副總裁” 。
早年 , 他在鵝廠、字節推動很多項目從0到1 , 也在生數科技這樣的初創AI公司留下拿得出手的漂亮成績 。
問起他對自己的評價 , 廖謙說從最早期的生成式AI , 到如今多模態階段 , 自己一路從算法到產品 , 再到商業化的完整路徑都走過;做過國內市場 , 也做過海外市?。 淮蟪?, 也有0到1的創業經驗 , “對于‘技術如何變成產品價值’這件事 , 有比較系統的理解 , 也有足夠的實操經驗 。 ”
所以 , 當做出自己創業這個決定的時候 , 廖謙沒有遲疑 。
AI Agent創業 , 極致上下文要做什么?今年8月底 , 廖謙正式成立極致上下文 。
公司的首要目標是打造面向營銷場景的多模態Agent 。
營銷是個生產力方向 , 很垂直 , 落點也很明確 。
把營銷場景作為切入的具體路徑 , 無外乎營銷場景需求明確、效果可量化、付費意愿強 , 在他看來 , 這里最能體現AI的真實價值 。

而選擇做Agent是因為它面向更廣泛的用戶群 。
一個優秀的Agent可以像專業Agency一樣理解雇主(也就是用戶)訴求 , 從創意策劃、腳本生成到視頻成片 , 全流程自動完成 , 用戶只需要輸入品牌信息和風格需求 。
做一個Agent , 就像是給用戶打造的一個全年無休的“007”乙方 。
“Agent使用起來無需學習技能、交互極簡 , 像人與人之間的交流方式 。 即便只有模糊的想法……甚至不確定自己想要什么 , Agent都能理解并生成內容 。 ”廖謙進一步解釋道 , “而且Agent以用戶的結果為中心 。 我們告訴用戶一個明確的價格和可達到的質量標準 , 讓他來判斷是否符合預期 , 從商業模式上來看 , 這更理想也更友好 。 ”
他把這種模式稱為“預期思維”或“結果導向” 。
做AI工具 , 需要讓用戶學習功能、寫提示詞;做Agent , 則需要Agent反過來理解人 。
——好的產品一定會持續降低用戶的各種成本 , 無論是使用成本(不需要學習和反復試錯)、理解成本(用戶能一眼明白得到什么)還是價格成本(花得明白、物有所值) 。
當“為什么做Agent”的原因清晰后 , 極致上下文的用戶主力畫像就呼之欲出了 ,“我們的用戶 , 是那些大概知道自己要什么 , 但不需要懂怎么做的人” 。

廖謙表示 , 在產品路徑上 , 極致上下文會先聚焦于營銷場景下的AI Video Agent , “幫助品牌更好地做視覺化表達 , 提供從創意、腳本到視頻生成、編輯的端到端能力” 。
在中長期規劃上 , 則是想搭建一個AI時代的信息表達系統 , 讓任何人都能實現個性化自我表達的平臺 。
早期谷歌時期是搜索時代 , 人找信息;過去十年移動互聯網是推薦分發時代 , 信息找人 。
現在 , 大模型讓“信息的表達”變得前所未有地容易 , AI正在讓“表達”這件事重新被定義 。 生成模型讓任何人都能以更自然的方式去表達意圖 , 無論是品牌還是個體 , 都需要更精準、更個性化的視覺語言 。
所以他判斷:
下一階段的核心競爭力 , 是誰能幫人、幫品牌、幫組織更好地表達自己 。
未來 , 這套系統的能力還可以拓展到教育、生活方式、娛樂等更多領域 。
創業的底氣從哪里來?“我一直知道自己遲早會創業 , 只是一直在等一個值得真正All in的時刻 。 ”
從技術周期上看 , 今年確實像是個拐點 。
語義理解、鏡頭語言、畫面真實度全面提升 , Google Veo3和Sora 2等都用實際效果隱隱告訴行業 , 技術已經進入“可用”的臨界點 。
接下來就要看誰能把能力轉化成真實的產品價值——廖謙眼中最值得All in的時刻 , 來了 。

在過去十年的職業經歷中 , 廖謙幾乎完整經歷了從算法到產品、從國內到海外、從大廠到創業的完整路徑 。
他本碩均就讀于西安電子科技大學 , 本科電子信息工程專業 , 碩士階段主修計算機視覺 。
2015年碩士畢業后 , 廖謙進入騰訊天美游戲工作室 , 參與游戲研發;兩年后 , 他轉崗至騰訊云 , 負責AI人臉人體業務 , 從零起步將這條業務做到國內第一、全球第三 。
騰訊工作的6年期間 , 他第一次體會到算法在應用層爆發的能量——當年風靡朋友圈、上線十幾天沖到圖片類榜單第一的“她拍”小程序 , 就由廖謙所在團隊來提供人臉融合技術 。

2021年 , 他加入字節跳動火山引擎 , 從0到1打造了“智能創作云” 。 廖謙表示 , 這是當時團隊流量最高的產品 。
兩年后 , 他又在剪映內部孵化出海項目Pippit 。 他是當時這個項目的發起人 , 同時也是平臺和商業化的負責人 。
Pippit是一個海外商家的AI內容生產與分發平臺 , 目前月活已超過百萬 。

到了2024年年初 , Sora一石激起千層浪 , 幾乎所有的AI從業者都在談論走在東京霓虹燈下的墨鏡女郎 。 廖謙猛然意識到 , 新的一輪技術周期開始 。
趁著這股東風 , 他離開大廠 , 選擇加入專注多模態基模的創業團隊生數科技 , 開始主導Vidu的產品、研發、運營和營銷工作 , 帶領超百人團隊 。
在生數工作的一年時間里 , 他主導了十余次算法與產品迭代 。
而這段經歷中最被他看重的創新 , 是在生數行業首創了“參考生視頻(Reference to Video)”功能 。
參考生功能的意義在于多模態模型開始具備上下文記憶 , 它能理解不同主體及其特征 , 還能參考之前的素材和風格 , 實現內容的連續性和一致性 。 就像AI在創作一部長劇 , 當它生成第十集時 , 已經理解前九集的風格和邏輯 , 能保持統一的調性 。
(是不是就更能理解他為啥給自己公司起名叫“極致上下文”了?)
“這個時代沒有傳統意義上的護城河”“你們公司的護城河會是什么?”
廖謙沉默了片刻 , 回答說:“這個時代沒有傳統意義上的護城河 。 ”
他提到一個典型例子 , Sora 2 。 它的發布不僅再一次證明了OpenAI的野心——不滿足于做模型公司 , 要向產品和平臺演進 , 更重要的是它攪亂了原本的競爭格局 。
用更直白的話來說 , Sora 2直接打到了抖音、TikTok、等巨頭的腹地 , 侵蝕了它們的核心業務 , 迫使它們在核心業務上花大量資源、精力防守 。
但對初創公司來說這是個好消息 。
巨頭互毆 , 過程中不得不拿出一部分精力自保 , 這意味著他們在其他方向上的創新會慢下來 , 創業公司就擁有了進攻窗口期 。
當巨頭忙著守 , 你就有機會去攻 。 去定義新的內容形態、新的協作方式 , 甚至新的信息分發邏輯 。
不過廖謙還說了 , 如果一定要說優勢 , 應該是“我們對用戶和場景的理解 , 以及團隊的熱愛” 。
他想了想 , 表示最近極致上下文團隊的大部分同學干勁滿滿 , 早上8點多就到了 , 大家每天工作幾乎超過14個小時 。

由于新公司早期業務聚焦AI Video Agent , 還是在和視頻生成打交道 , 我們詢問了廖謙關于AI視頻方面的未來預判 。
廖謙判斷 , 在模型層面 , “一致性”是絕對可預見的提升方向 , 而且是接下來重點解決的方向 。
因為就連頭部梯隊的Sora 2一致性也還不夠好 。 “大家喜歡用Sora 2和奧特曼‘合拍’ , 里面奧特曼的角色一致性保持得比較好 , 但用戶自己的形象大部分都不夠好 。 ”
除了畫面之外 , 音色的一致性可能在未來3到6個月內基本被解決;畫面美學 , 構圖、光影這些要素也都有待提升 。
One More Thing“前幾天和大廠的老同事吃飯 , 問我創業感受 。 ”
“我的Co-founder的回復特別好——想聽真話還是假話?真話就是 , 工作時長更長了 , 但反而沒有大廠那么累 。 ”
”創業是一種生活方式 , 這種感覺是焦慮 , 也是興奮 。 ”
“你知道自己在為一件值得全力以赴的事努力 。 ”

— 完 —
量子位 QbitAI · 頭條號
【剪映前AI產品負責人創業多模態Agent,成立半月融資數百萬美元】關注我們 , 第一時間獲知前沿科技動態

    推薦閱讀