剛剛,MiniMax來承包你的桌面了

剛剛,MiniMax來承包你的桌面了

文章圖片

剛剛,MiniMax來承包你的桌面了

文章圖片

剛剛,MiniMax來承包你的桌面了

文章圖片

剛剛,MiniMax來承包你的桌面了

文章圖片

剛剛,MiniMax來承包你的桌面了

文章圖片

剛剛,MiniMax來承包你的桌面了
機器之心編輯部
如果說 2025 年是 Agent 落地元年 , 那么剛剛開始的 2026 年勢必迎來新一輪爆發 。
一開年 , Agent 賽道便進入到了白熱化的競爭 , 國外如 Anthropic 發布 Cowork , 國內如千問 APP 上線「任務助理」 。 在這一背景下 , 市場出現了分化 , 或專注于工作提效 , 或聚焦于日常生活體驗重塑 。
在這個紅海市場 , 10 多天前登陸港股的國產 AI 大模型獨角獸 MiniMax 選擇的路線是「將釋放生產力進行到底」 。
1 月 20 日 , MiniMax 揭開了其第二代智能體產品 ——MiniMax Agent 2.0 的面紗 , 為這個火熱的 AI 賽道添加了又一個生力軍 。 此次的更新被定義為了一個「AI 原生工作臺」(AI-native Workspace) , 從產品形態和能力分布上進行了深度重構 。
這個全新的工作臺不再像過去那樣依賴簡單的 Chat 式對話框 , 而變身為能感知本地環境、自主拆解復雜任務且提供專家級專業技能的進階型智能協作伙伴 。 這些能力實現的背后立著以下三大核心支柱:
首先是桌面端應用「MiniMax Agent Desktop」 , 它讓 Agent 跳出了瀏覽器網頁 , 而能在操作本地文件和本地環境的同時啟動網頁自動化任務 。 這意味著 , 該 APP 實現了本地與云端之間的無縫連接 , 通過一個全局視角滲透到各個職能角色的核心工作流中 , 將人類從「在不同窗口間切換、復制粘貼、點擊按鈕」的重復勞動中解放出來 。
MiniMax 桌面端已經上線了 Windows 和 Mac 雙版本 。
其次是「Expert Agents」, 打造垂直領域的頂級專家分身 。 Expert Agents 超越了現有預設的 Multi-agent 的 Pro 模式 , 通過封裝私有知識和行業獨家 SOP(標準操作流程) , 用專家級的知識、能力和經驗儲備來武裝用戶 。
MiniMax 表示 , 1.0 時代依賴的 Multi-agent 多專家系統只能提供 70 分的通用專家組合 , 現在借助 Expert Agents 可以將這一分數拉升到 95 分甚至 100 分 , 可靠性有了質的提升 。 并且官方還會提供大量開箱即用的 Expert Agents , 降低了操作門檻 , 上手更輕松 。
用戶現在可以在桌面和網頁雙端限時免費體驗 Expert Agents 功能 。
最后定義自己的 Expert Agents , 通過更多的上下文信息和更自由的自定義設置 , 讓 Agent 在更懂你的基礎上提供個性化的專家服務 。
如果說去年發布的 MiniMax Agent 1.0 定義了「靠譜的 AI 伙伴」 , 如今的 2.0 在同樣確保結果的準確性之外 , 在 AI 原生自動化執行的廣度、深度、專業度上來了波全方位加強 。
一手實測:這個 Agent 真是能文能武
表現如何還得看實戰 。 打開 MiniMax Agent 官網, 下載最新上線的 MiniMax 桌面端 , 即可開啟 AI 原生工作臺體驗 , 重塑工作流 。

官網地址:https://agent.minimaxi.com/
安裝完成后 , 在引導界面可以看到 MiniMax 桌面端已經深度打通本地文件 , 我們只需選定一個工作目錄 , 即可讓 AI 讀取、分析、批量處理該目錄下的所有文件 。 這一設計體現了其打造「AI 原生工作臺」的核心思路 。
下面就開始測試吧 。
作為一家媒體 , 我們的日常工作中一大很重要的任務是刷選題 , 直接輸入下面的提示詞 , 看看我們能否在 MiniMax 桌面端中讓 Agent 自主實現這個定時任務 , 提升我們刷選題的效率 。

每天 9:00 為我提供過去 24 小時內 AI 領域的重點新聞摘要 。 每條新聞提煉一個核心要點 , 并附帶網絡檢索來源 , 確保清晰易讀

4 倍速視頻
僅僅 2 分多鐘 , MiniMax 的 Agent 就成功完成了任務 , 正確編寫了腳本并進行了可行性測試 。 不僅如此 , 該 Agent 還給出了后續實現定時任務的教程 , 讓我們只需一些復制粘貼 , 即可在我們的設備上將這個 AI 任務變成每天上午的日常 。 下圖總結了此次任務的執行結果:

而作為一家專業的人工智能媒體 , 讀論文也是我們的一個日常 , 接下來我們試了試讓 MiniMax 桌面端分析解讀 MiniMax-M1 背后的技術脈絡 。
這是 MiniMax-M1 的技術報告 https://arxiv.org/pdf/2506.13585 , 研究其參考文獻 , 了解其背后的技術 , 然后制作一個網頁 , 展示 MiniMax-M1 背后的技術進化圖譜 , 務必盡量往前追溯 。
很顯然 , 這個任務會更加復雜一些 , 耗時大概 6 分鐘 。

4 倍速視頻
在執行過程中 , Agent 首先分析了任務需求 , 然后調用工具下載了指定文檔 , 之后對文檔進行了分析解讀以及技術追溯 。 之后 , 它又按照要求編寫了一個網頁來進行了展示 。
最后 , MiniMax 的 Agent 為我們創建了這樣一個網頁 , :

不僅如此 , 該 Agent 還自動在 MiniMax Space 上部署了這個網頁 ,讓我們可以直接使用和分享這個網頁:https://sqwu1jsy96cd.space.minimaxi.com/
這種從研讀到交付的閉環能力 , 展現了其在任務執行上的工程深度 。
當然 , 得益于工作目錄的設計 , MiniMax 桌面端不僅能處理單篇論文 , 更能直接處理一個裝滿文件的文件夾 。 舉個例子 , 我們的日常工作將會積累很多選題 , 其中包括一些高質量的技術博客 , 使用以下提示詞 , 我們可以讓 MiniMax 將這些博客從文檔中提取出去 , 并制作成精美的 PPT 進行展示 。
這是我們近幾個月的日常選題整理文檔 , 請梳理出其中所有的技術博客 , 并訪問每篇技術博客的內容 , 給出簡短的內容整理 。 將結果整理成一個 PPT , 每一頁展示一篇技術博客 , 其中應包括一些引用自博客的圖片或截圖、博客標題和鏈接以及內容簡介 。 使用莫蘭迪色系 。
這個任務就更加復雜了 , 而且非常繁瑣 , 也因此我們此前都沒去處理 。 而在 MiniMax 桌面端的幫助下 , 我們僅用 23 分鐘時間就完成了整個任務 。

16 倍速視頻
可以看到 , 我們的初始文件是一大堆的 docx 文檔 , MiniMax 桌面端首先調用工具將所有這些文檔轉換成了 LLM 最喜歡的 markdown 格式 , 然后讀取詳細內容 , 并提取出了分散在各個文檔中的技術博客 。 之后它繼續調用工具 , 讀取了文檔中這些技術博客鏈接的具體內容 。 之后它繼續推進 , 將這些內容總結成了適合制作 PPT 的文案 , 接下來 , 還是調用工具 , 它使用這些文案生成了圖像和演示 PPT 。
至于效果 , 可以說是超乎想象地好 。

通過以上測試示例 , 我們看到了 MiniMax 桌面端在日常工作中對我們的強大助益 , 同時 , 我們也看到了將 Agent 接入本地計算機的無限可能性 。
舉個例子 , 對以上視頻的加速處理 , 我們也完全是通過 MiniMax 桌面端完成的 。 而我們所做的 , 不過是輸入了這樣一段提示詞:
處理一下文件夾中的視頻:將 MiniMax-1 和 2 加速 4 倍 , 將 3 加速 8 倍 , 將 4 加速 16 倍 。 我本地已經安裝 ffmpeg 。
Agent 精準識別了本地環境中的工具路徑 , 并生成了對應的處理指令 。 無需用戶手動輸入復雜的命令行參數 , 視頻加速任務便在后臺安靜、高效地完成了 。

最后 , 我們還簡單嘗試了 MiniMax 提供的專家 Agent 創建能力 。 據介紹 , 該功能「允許用戶構建在特定領域達到 95 分甚至 100 分的領域的專家 Agent 。 不僅僅是簡單的 Prompt 調整 , 而是深度的知識與能力注入 。 」
創建過程非常簡單直觀 。 在對話框左下方選擇「子代理」→「管理子代理」 , 即可創建出可以多次復用的 Agent , 比如這里我們簡單創建了一些「專家」 。 而在每個 Agent 的配置中 , 我們也可以選擇啟動不同的工具 。

之后 , 我們只需在開啟任務之前選擇我們想要使用的子代理 , 即可將相應的 Agent 納入到我們的工作流程中 。 比如在下面的例子中 , 我們啟用了上面配置的一系列專家 , 然后讓它們圍繞「AI 究竟是什么」進行了一系列深度探討 。 這時候 , MiniMax 本身會化身這場多智能體討論的主持人 , 通過在探討中調用不同配置的子代理 , 實現對這一話題多視角反復深度討論 。

這項能力具有巨大的想象空間 。 它意味著用戶可以將行業經驗、部門 SOP 甚至復雜的業務邏輯轉化為可調用的模塊 。 當用戶面對一項復合任務時 , 不再是與一個通用模型交談 , 而是指揮一支由特定領域專家組成的數字團隊 。 這種從「單點能力」向「專家協作」的轉變 , 為大模型在專業垂直場景的落地提供了更具實操性的路徑 。
整體體驗下來 , 我們看到 MiniMax Agent 能夠理解復雜的 SOP 流程 , 自主調用本地與云端工具 , 將原本需要多款軟件協作的任務濃縮在單一的提示詞輸入框中 。 這種以任務完成率為核心的設計 , 正是 MiniMax 試圖定義的 AI 原生工作范式 。
從刷分到會干活:MiniMax 正在重新定義 AI 能力邊界
總結來看 , MiniMax Agent 2.0 并不是在展示它想得有多聰明 , 而是在證明它能把事做到哪一步 。
在 Agent 2.0 的工作方式里 , AI 不再等待人類一次次補充上下文 , 而是主動進入工作環境 , 理解你的文件、網頁、工作流程 , 持續推進任務本身 。 你只要給出一個指令 , 剩下的拆解、執行與跟進 , 交由 Agent 在 Workspace 中完成 。
這也解釋了為什么 MiniMax 要把 Agent 2.0 定義為 AI-native Workspace 。
這背后 , 是 MiniMax 在模型層面的持續升級 , 以及一套在內部真實運轉的工作方式 。
去年 6 月提出的 Lightning Attention 將長序列計算成本從二次方降為線性 , 讓 Agent 不再失憶;10 月發布的 M2 定位為 Agent & Code Native , 采用交錯思維機制和 MoE 架構(230B 總參數、10B 激活) , API 價格僅為 Claude Sonnet 4.5 的 8%;12 月的 M2.1 則向 Rust、Java、C++ 等后端語言深入 , 使得模型具備全棧工程能力 。
而這些能力 , 首先被 MiniMax 自己用在了內部 。 模型被直接嵌入研發與辦公的核心流程 , 從寫代碼、拆需求到跑 Agent 任務 。 據了解 , 在過去數周內 , MiniMax 內部接近 100% 的同學開始使用 Agent 實習生 。
這樣一來 , 模型能力的每一次升級 , 都會在真實業務中被高頻使用和反復打磨 , 而內部產生的反饋 , 又返回到下一輪模型和系統設計上來 , 形成了一條快速自我強化的迭代閉環 。
此次 MiniMax 定義的「AI 原生工作臺」將掀起一場對 AI 參與高復雜度工作的價值重構 。 其中一點是交互邏輯發生了變化 , 從「人要被動適應 Agent」變為「Agent 主動適應人」 。 另外通過定制化的 Expert Agents , 專業壁壘被打破 , 普通人無需經歷漫長的學習就能獲得行業頂級的知識與經驗 。
【剛剛,MiniMax來承包你的桌面了】文中視頻鏈接:https://mp.weixin.qq.com/s/I2RgH04J2l5mG1x492T17A

    推薦閱讀