對標Genie 3 螞蟻靈波開源世界模型LingBot-World

對標Genie 3 螞蟻靈波開源世界模型LingBot-World

【TechWeb】1月29日消息 , 螞蟻集團旗下靈波科技今日宣布全面開源世界模型 LingBot-World 。 此前 , 靈波科技已先后開源空間感知模型LingBot-Depth以及具身大模型 LingBot-VLA 。
【對標Genie 3 螞蟻靈波開源世界模型LingBot-World】業內人士指出 , 隨著“靈波”系列連續發布三款具身領域大模型 , 螞蟻的AGI戰略實現了從數字世界到物理感知的關鍵延伸 。 這標志著其“基礎模型-通用應用-實體交互”的全棧路徑已然清晰 。
據介紹 , 最新開源的LingBot-World模型在視頻質量、動態程度、長時一致性、交互能力等關鍵指標上媲美 Google Genie 3 , 旨在為具身智能、自動駕駛及游戲開發提供高保真、高動態、可實時操控的“數字演練場” 。
其中 , 針對視頻生成中最常見的“長時漂移”問題(生成時間一長就可能出現物體變形、細節塌陷、主體消失或場景結構崩壞等現象) , LingBot-World 通過多階段訓練以及并行化加速 , 實現了近 10 分鐘的連續穩定無損生成 , 為長序列、多步驟的復雜任務訓練提供支撐 。
目前 , LingBot-World 模型權重及推理代碼已面向社區開放 。

    推薦閱讀