
文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

開源的風 , 終于是從大模型吹到了Agent 。
不要說線是歪的 , 因為通往AGI之路注定會有波折
前幾天 , 字節跳動旗下的Coze(扣子)平臺開源了 , 給本就熱火朝天的 Agent 賽道又加了波猛料 。
大家別光顧著吃瓜看熱鬧 , 其實這背后在說一件事:時代變了 。
以前大家比的是誰家模型更聰明 , 所以拼了命把訓練參數做大、把基礎模型做強 。
但現在真正的戰場 , 已經轉移到了怎么把大模型用好、用到實處 。
說白了 , 大家都已經不滿足做個簡單的Agent , 而是要看Agent 平臺怎么讓AI既能穩定地調用各種工具 , 又能高效地跟外部世界打交道 。
要聊明白這事兒 , 咱們得先看看AI Agent這幾年是怎么進化的 。
其實業界效仿隔壁自動駕駛的分級 , 也給Agent強度排了個L1、L2、L3……
最簡單的L1級別的AI Agent , 其實就是3年前火起來的以ChatGPt為代表的 , 一堆大模型對話助手 , 在這個程度 , 你也就只能把它當個聊天機器人、信息搜索庫 , 談不上什么生產力 。
后來 , 它學聰明了點 , 學會了用些小工具 , 進化成了L2 工作流助手 。
L2 級別的工作流 Agent 就像個聽話的學徒 , 你讓它上網查個資料、算個數 , 它能照著你設定好的步驟一步步完成 。
但說到底 , 還是得你這個當師傅的先把流程圖畫好 , 所以也沒啥特別的 。
真正讓人興奮的 , 是進化到L3級別的推理型Agent 。
突出的代表就是年初爆火的Manus , 這也是讓 Agent 有了自主思考和規劃的能力 。
這家伙已經開始像個獨當一面的員工了 , 規劃個旅游攻略、寫個PPT、做點論文草稿 , 分分鐘把活兒安排得明明白白 。
但問題來了 , 就好比人類的職場一樣 , 專家員工再牛 , 也干不了一個團隊的活兒 , 所以還是得靠人給一堆員工派活 。
但這個過程的難度 , 壓根不比你自己干來得輕松 , 可能活還沒派完 , 你的CPU先被干燒了 。
于是大家就想 , 能不能組個Agent團隊 , 讓AI來分配專業的AI干專業的事兒?
結果業界經過了各種各樣嘗試發現 , 這幫看起來牛逼得不行的Agent湊一塊兒 , 根本沒法合作!
因為你別看 , 現在單個Agent執行任務的成功率挺高 , 但只要組隊 , 成功率就斷崖式下滑 。
一個流程里 , 每一步都有95%的成功率 , 聽起來已經挺好的了吧 , 但只要跑上20步 , 整個任務的成功率就直接掉到30%了 , 是不是有你買足彩1串6、1串7那味兒了 。
就在大家為這幫散裝英雄一籌莫展的時候 , 前兩天 , 360集團正式發布的納米AI , 好像給出了一種新思路 。
納米AI , 有些差友可能還不大熟悉 , 人家是紅衣大叔周鴻祎 360 旗下的AI產品 , 最近升級成了“多智能體蜂群” , 還號稱是全球唯一真正進化到L4級別智能體 。
昨天 , 紅衣大叔還特地開了場專場發布會 , 給大家好好聊了聊納米AI如今的變化 。
差評君也去聽完了全程 , 然后還試用了一波 , 真覺得有點牛了 。
我先不說其他的 , 就給你看一個納米AI生成的視頻 。
差友們可以猜猜這個視頻咱花了多少精力 , 寫了多少提示詞 , 后期調整了多少 。
我來公布最終的答案 , 花的精力就是上傳了一張火鍋的照片 , 提示詞不到100個字 , 后期完全沒做任何處理 , 甚至在納米AI生成視頻的過程中 , 咱們還去找小發打了一把王者 , 游戲結束回來就看到了上面這個視頻 。
看視頻效果的時候 , 背后站了一堆編輯部同事 , 全在怪叫“牛逼牛逼” , 發群里也像是誤入藕花深處 , 驚起一灘“666” 。。。
當然了 , 我們也找了隔壁Manus做了個類似的視頻 。
盡管Manus調用了目前最頂級的Veo3視頻生成大模型 , 但什么情節、故事都不存在的 , 純靠著大模型的基礎能力硬撐畫面 。
而且 , 就像昨天直播里周鴻祎反復提及的“短視頻起號” , 納米AI主打就是“一句話生成大片” 。
你還能用更簡單的方法生成視頻 。
比如咱們常在影視劇刷到的介紹某個歷史人物生平的視頻 , 在納米AI里 , 直接就有一個專門的Agent叫古人傳記導演 , 你只需要說一句“于謙的一生” , 然后就什么都不用管了 。
結果生成的質量也還是相當高 。
說真的 , 這擱以前 , 在一些短視頻賬號起號階段 , 制作類似質量的視頻 , 一般是一個編導配2-3個剪輯花半天時間才能做出來 , 現在靠著納米AI , 點幾下鼠標十幾分鐘就有了 。。。
而且 , 咱們這個是最基礎的測試(其實是因為打王者 , 忘記調整細節了) , 兩個視頻完完全全都是納米AI一手導演的 。
而且實際執行過程中 , 你完全可以在視頻風格、語音音色、最終腳本等等模塊 , 進行調整修改 , 來幫助AI生成更好、更符合你需求的視頻 。
是不是已經覺得納米AI有點東西了?
昨天直播里 , 他們還表示 , 納米AI的多智能體蜂群能在一起連續工作2個小時 , 執行超過1000個步驟 , 處理9000萬個Token(相當于幾千萬個漢字)的信息量 , 中間不出錯、不掉鏈子 。
這個水平大伙可能有點暈 , 我就這么說吧 , 以 M 記為代表的L3級別的智能體 , 處理的token數一般只能在百萬級 , 換算成生成視頻 , 一般不超過90秒 。
所以昨晚老周在直播間也放出話來:“咱們就是目前唯一一個能做10分鐘視頻的Agent 。 ”
為什么納米AI能實現L3到L4的突破呢?
其實是因為他們找了條多智能體并行的新路子 。
簡單來說 , 納米AI有個超大智能體工廠 , 里面有5萬個L3級別(也就是和M記同一級別)的Agent來滿足你的各種需求 。
如果你覺得這5萬個都不行 , 也能自己再做新的L3級別Agent進去 。
這么一來 , 你手底下就有幾萬個 , 未來還能越來越多的Agent幫你干活 。
在360智能體工廠的基礎 , 再加上納米獨創的L4技術 , 才有了史上最長的10分鐘AI視頻 。
這套L4技術說白了 , 就是在納米多智能體蜂群的平臺里 , 給這幫平日里單打獨斗的Agent們 , 加裝了一套超級通訊系統和共享的作戰指揮室 。
除了有部門經理和項目經理互相調度 , 各個賽博牛馬之間也不再有溝通障礙 , 所有智能體都在同一個頻道里聊天 , 一個眼神就知道對方想干啥 , 再也不怕傳話傳歪了 。
我們拿前面于謙的視頻舉例 , 我提示詞只輸入了“于謙的一生” 。
納米AI能夠自己思考我要的是啥 , 比如要的是歷史人物于謙 , 不是德云社的大爺于謙 。
然后根據這個思路一點點研究于謙的生平 , 編寫文案標題和相應的分鏡腳本 , 接下來 , 又會根據這些分鏡生成相應的圖片 , 再把圖片生成視頻片段 , 最后再像一個后期一樣 , 把這些片段素材全部整合到一起剪輯成成片 。
而且 , 在這個執行過程中 , 納米AI能夠最多支持100個工具同時調用 。
你可別小看這個數字 , 之前Manus爆火的時候 , 網上對它的詬病最多的就是速度實在太慢 , 因為它作為L3級別的Agent , 只能一項命令一項命令的執行 , 調用上一個工具 , 完成需求 , 才能繼續思考下一步怎么做 , 想清楚之后再調用下一個工具 。
但納米AI的多智能體蜂群完全能夠做到邊想邊干 , 我這邊還在調用工具進行配音 , 那邊已經在想著調用大模型生成視頻畫面了 , 這也大大提升了Agent的執行速度 。
不僅如此 , 更絕的是 , 納米AI為了搞定步驟一多 , Agent容易出錯雪崩的情況 , 還做了點安全冗余 。
周鴻祎在直播時透露自家產品用了一套比較暴力的解決方式 , 那就是用token換正確率 。
比如生成某段視頻的分鏡圖片時 , 單智能體不是容易出錯嗎?
但納米AI可以多智能體并行操作 , 那我每個畫面都同時找三四個畫手一起畫 , 加一個把關的步驟 , 把生成失敗、出錯的剔除出去 , 保留正確的畫面 , 這樣就能大大提升成功率了 。
當然了 , 盡管有了這些安全冗余 , 但AI還是會出錯 。
咱們在測試時 , 也出現了一次任務報錯 , 但納米AI人還怪好的 , 因為有些Agent任務出錯了消耗的token可不退你 , 而納米AI是全額返還的 。
至于一些生成視頻文字上的瑕疵、前后一致性還不是完美之類的問題 , 偶爾也還是會出現 。
但那句話怎么說的 , 只要方向對了 , 走得再慢也是在一步步接近目的地 。 而類似大模型基礎能力上不足 , 其實也是目前業內大伙們提升的方向 。
而且 , 該說不說 , 咱挺認同納米AI現在的這個思路的 。
周鴻祎昨晚也說了 , 現在制作短視頻其實是人人的剛需 , 你做什么賬號能不做短視頻 , 甚至發朋友圈也要vlog吧 。
買書買課不如學會用AI
那讓AI最快成為人人都愛用的、能改變大家生活的方式 , 不就是在解決大家的實際需求嗎?
強如大模型也得做一個ChatGPT的載體 , 才能在全球爆火 , 而Agent界的ChatGPT遲遲沒出現 , 這也是為啥業界和用戶之間有種割裂感 。
啥公司都在說我們有Agent , 多牛多牛 , 但我一個普通老百姓 , 感覺根本用不到啊 。
而且 , 納米AI的一句話生成視頻 , 只是他們選擇的主攻點 , 實際上 , 你可以在L4級別多智能體蜂群里 , 根據自己的需求從0搭建專屬自己的AI團隊 。
喜歡吃瓜的 , 可以做一個每天娛樂大新聞總結Agent;喜歡體育的 , 可以做一個專屬自己的體育報道AI天團 。。。
昨天周鴻祎一直在強調 , 目前的大模型能力已經相當強悍 , 但出于各種原因 , 它真正的能力并沒有完全展現 。
在他看來 , Agent就是目前能夠最大限度挖掘大模型能力的橋梁 , 而通過多智能體共同參與 , 就能很好地處理現階段的一些人類需求 , 真正讓人覺得AI牛逼 。
說到底 , AI的未來 , 可能不取決于技術參數有多高、模型有多大 , 而在于它能不能像納米AI這樣 , 少談點玄乎的概念 , 多做個好視頻、寫個好方案 , 可能更有用 。
當AI不再是一個遙不可及的神 , 而是我們隨時可以拉來組隊干活、不知疲倦的賽博牛馬時 , AI的下半場 , 才算真正開場了 。
【一鍵生成十分鐘長視頻?我發現了一個超強的起號套路】
推薦閱讀
- 1句話生成可玩的3D世界!谷歌Genie3震圈登場,世界模型終于迎來ChatGPT時刻
- 新加坡國立大學:TPDiff讓AI視頻生成快兩倍
- 實測豆包一鍵修圖,拍照小白有救了|附修圖指令
- 生成式AI迎來應用熱潮,快手可靈AI上線多款新功能丨最前線
- 國產視頻生成再突破!從影視級短片到遠洋親情連線,AI讓天涯變咫尺
- 對話生數科技CEO駱怡航:參考生視頻讓創作回歸本質,下一步將推進實時生成
- Google將AI驅動的照片生成視頻功能擴展至更多應用
- 免費用 不限量!通義靈碼上線Qwen3-Coder:代碼生成能力大增
- 夸克、浙大開源OmniAvatar,一張圖+一段音,就能生成長視頻
- 百度視頻生成模型MuseSteamer開放H5體驗入口
