一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片

一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發

文章圖片


克雷西 發自 凹非寺
量子位 | 公眾號 QbitAI
終于 , “養蝦人”們也有自己的專屬模型了 。
就在今天 , 智譜稍早前開始內測的神秘模型Pony-Alpha-2終于揭開了真實身份——全球首個“龍蝦特供”模型GLM-5-Turbo 。

而且為了讓你更方便地吃蝦 , 這次智譜還專門準備了龍蝦套餐 , 包含個人版和Team版 , 39元即可獲得4000萬Token 。

如果拿它來做“蝦腦” , 從零開始定制一套喂飯級的小眾旅游攻略 , 不過是件分分鐘的事情 。

這個過程當中 , 像什么深度研究、檢索總結還有生成網頁那些很長的流程 , 都能被GLM-5-Turbo安排得有條不紊 。
這是因為GLM-5-Turbo深度優化了復雜工作流中的工具調用與多智能體協同能力 , 在極其吃吞吐量的極限場景中表現出了極強的穩定性 。
很容易看出 , 這些重點優化的能力 , 全都是面向龍蝦場景做的 。
在智譜自己組織的“龍蝦測試”ZClawBench(題庫與測試軌跡已全面公開)當中 , 它斬獲了國產模型綜合成績第一 。

而且 , 這個專為干重活定制的滿血大模型 , 現在直接通過AutoClaw(澳龍)應用就能零門檻直接調用 。
“首個龍蝦模型”一手體驗那么 , 這個“龍蝦特供”模型到底好不好用呢 , 咱們接下來就開始吃蝦 。
智譜前兩天剛發過澳龍框架 , 能把龍蝦的安裝流程一鍵搞定 , 而且GLM-5-Turbo可以在里面直接選擇 , 搞API的過程也被省掉了 。
為了方便起見 , 這次咱們就不搞聊天/辦公軟件接入 , 直接在澳龍里和模型對話了 。
任務一:小紅書文案連載策劃第一個任務 , 我想體驗當一個小紅書沙雕博主 , 同時又想蹭一蹭AI話題 , 于是我把我的想法告訴了搭載GLM-5-Turbo(由于是搶先體驗 , 我玩的時候模型還叫Pony-Alpha-2)的澳龍 。
而且要做就做連載 , 我告訴它直接給我準備一周的策劃 , 把標題、文案、話題標簽、評論區引導話術 , 還有配圖建議 , 全都給我搞定 。
以“AI每天幫我過沙雕生活”為主題 , 生成一套完整的小紅書連載筆記(共7篇) , 每篇包含吸睛標題、正文故事、配圖、評論區引導話術和hashtags 。
不一會兒 , 澳龍就把這七天的文案全都準備好了 , 同時給出了我發布節奏建議 , 整套方案全都是文案本體 , 沒有半點廢話 。
而且每篇結尾都埋下了“未完待續”的鉤子 , 引導粉絲關注追更 , 甚至最后一篇結尾還“自作主張” , 建議我用投票預熱第二季 , 形成系列IP 。

至于具體內容 , 我看完這套連載筆記 , 最直觀的感受就是 , 它把AI那種帶著邏輯色彩的“冷幽默”給玩明白了 。
平時咱總覺得AI是個嚴肅的工具 , 但在這份回答里 , 它反倒像個嘴毒又細心的管家 。
比如第3篇里那個“烏龜暴走GIF”的社死現場 , 這種細節抓得特別準 , 一下子就把AI建議的“保持幽默”和人類實際操作時的“手忙腳亂”這種反差感拉滿了 。

還有第6篇里算奶茶賬的那段 , AI說把快樂換成“免費的白開水” , 這種一本正經胡說八道的情節 , 確實很符合小紅書那種自嘲式沙雕生活的調性 。

接下來呢 , 我讓它幫我把這一大長串拆開 , 每天的文案都放在一個獨立的文檔中 。

當然了 , 用澳龍玩GLM-5-Turbo還有一個好處就是 , 它內置了很多的Skills , 可以直接調用智譜家的圖像、視頻生成等模型 , 使用時消耗的是澳龍積分 , 不用再配置任何東西了 。
所以接下來 , 我就讓它把所有的配圖也都一并代勞了 , 它先給我繪制了7篇文章的封面 。
看到生成結果 , 我發現第三天的封面真的包含了之前被重點cue到的“烏龜表情包” 。

接下來我讓它把剩下的圖也給我畫好 , 這次它沒在聊天框里一張張發給我 , 而是把所有圖片的鏈接全都塞進了README.md里 。

最后呢 , 我讓它仿照小紅書的UI幫我做一個HTML效果頁 , 不過這里我只讓它做了第一天的 。
可以說它不僅完整展示了內容 , 還高度還原了小紅書的界面設計 。
任務二:全棧應用開發雖然我剛剛給自己塑造了一個沙雕的人設 , 但我的內心 , 其實是個技術宅 , 平時就喜歡搞一些小應用來把玩一番 。
所以接下來 , 我也給GLM-5-Turbo安排了一個全棧開發的任務 。
設計一個本地運行的實用個人記賬全棧應用 , 支持記錄一筆支出(金額、分類、備注、日期)、查看支出列表、刪除記錄、顯示本月總支出和分類統計 。 應用前后端分離 , 后端負責數據存儲和匯總計算 , 前端提供錄入和查看界面 。
它先用Node.js + Express + SQLite做后端 , HTML/CSS/JS做前端 , 迅速幫我把程序搭建了起來 。

尷尬的是 , 寫完之后它發現我這臺電腦里壓根兒沒裝node.js , 不過并沒有因此就亂了陣腳 , 而是開始檢查我的電腦里有什么能用的 , 然后改用Python重新寫了個后端 。

寫完之后 , 它就開始對代碼進行測試 , 通過API對后端服務進行了驗收 。

而且還沒忘把之前node.js的版本刪掉 , 然后又幫我寫了一個啟動腳本 。

啟動之后 , 就可以在瀏覽器里打開這個記賬本了 。

我向其中輸入了一些數據 , 刷新之后數據依然可見 。

以及在電腦端打開時添加的記錄 , 手機端刷新之后也能顯現 。

并且在后臺日志當中 , 也能看到我的添加動作 , 說明這一波的程序是真的跑通了整個前后端和數據庫 , 而不是只有一個靜態頁面在模擬 。

任務三:本地環境操縱既然是龍蝦模型 , 那自然還得放到本地環境里看一看它的表現 。
這次我扮演的是一名電商運營 , 從SkyTrade、GlobalHub和OceanMall三個平臺(都是我虛構的名字)拉取了銷售數據 , 結果這三個平臺給出的數據格式完全不一樣 , 既有JSON , 又有表格 , 甚至還有純文本 。

我希望它能幫我把這些混亂的數據清洗一遍 , 然后給我一份匯總表 。
你現在直接接管我桌面上raw_orders文件夾里的所有原始底稿 。 這里面塞滿了SkyTrade、GlobalHub和OceanMall三個平臺的訂單 , 格式極其混亂 , 還埋了不少跨平臺重復的客戶、殘缺的支付金額和五花八門的日期 。
你的任務是把這堆爛賬盤清楚:自主完成所有平臺的數據對齊與清洗 , 結合成本配置文件 , 盤出本月的真實凈利潤 。 你需要幫我揪出那3個由于高頻率退貨或運費倒掛導致的“退貨黑洞”商品 , 并畫像出貢獻最大的5個頂級金主客戶(注意聚合跨平臺的同名ID) 。
最后 , 直接在當前目錄下給我交付一份Markdown月度經營分析報告 , 并配套生成一份精細化的財務匯總表 。
結果 , 澳龍寫了個Python程序 , 就把我這些混亂的數據 , 一次性都給盤清了 。

跑完程序之后 , 它不僅生成了我要的表格 , 還直接在對話框里向我匯報了整理的結果 。

另外我關心的“退貨黑洞”和“五大金主”這兩個問題 , 澳龍也都在對話中給我解答了 。

“龍蝦專供”模型 , 還有“龍蝦專供”套餐之所以能成為一個“龍蝦特供”模型 , 是因為GLM-5-Turbo這一波優化的重點 , 就是工具調用和多智能體協同 。
實測當中我也感受到 , GLM-5-Turbo不僅讓龍蝦更加聽話 , 在跑多環節、長路徑的復雜任務時 , 也能明顯感覺到有條不紊 。
而且它能精準調用各種外部工具和Skills , 把需求拆解成詳細步驟 , 再指揮好幾個龍蝦助手分工合作 。
最關鍵的是 , 每個環節的銜接都很順滑 , 你基本不用擔心它會中途掉鏈子。
【一手實測首個龍蝦模型:長路徑任務不失誤,一人包攬全棧開發】另外 , 它對時間維度的理解也很到位 , 不管是你定點定時要跑的任務 , 還是那種一干就是好幾個小時的大工程 , 它都能穩穩當當地替你執行下去 , 中間不中斷 。
還有就是在編程這件事上 , 靠直覺碰運氣的Vibe Coding , 也跨越到了真正的智能體工程(Agentic Engineering)水平 。
在極少需要你人工干預的情況下 , 模型就能自主搞定長程規劃和最后的系統交付 , 哪怕你是一個人 , 也能鎖定大團隊才能折騰出來的那些成果 。
而為了讓這些能力真正落地到你的桌面上 , 智譜又在之前的Coding plan之后 , 推出了面向企業的龍蝦套餐(Claw-plan)。
這種模式之下 , 企業為它付費的邏輯從“買token” , 變成了“雇傭一個數字員工” 。
目前 , 智譜已經正式開售這個企業龍蝦套餐了 , 開發者和企業用戶可以通過智譜開放平臺BigModel.cn直接調用API , 或者通過龍蝦套餐接入 。
另外在GLM Coding Plan當中 , Max版也已經納入了GLM-5-Turbo , Pro套餐也將在本月盡快支持 , Lite套餐將在4月支持接入 。
如果你正愁怎么處理手頭那些復雜的Agent場景 , 這絕對是性價比極高的選擇 。
“澳龍”下載地址:https://autoglm.zhipuai.cn/autoclaw/API接入(智譜開放平臺):https://www.bigmodel.cn:了解龍蝦套餐:https://www.bigmodel.cn/claw-plan-team
— 完 —
量子位 QbitAI
關注我們 , 第一時間獲知前沿科技動態

    推薦閱讀