剛剛，MiniMax來承包你的桌面了

2026-03-29 人工智能紀超機器人唐山

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

機器之心編輯部
如果說 2025 年是 Agent 落地元年，那么剛剛開始的 2026 年勢必迎來新一輪爆發。
一開年， Agent 賽道便進入到了白熱化的競爭，國外如 Anthropic 發布 Cowork ，國內如千問 APP 上線「任務助理」。在這一背景下，市場出現了分化，或專注于工作提效，或聚焦于日常生活體驗重塑。
在這個紅海市場， 10 多天前登陸港股的國產 AI 大模型獨角獸 MiniMax 選擇的路線是「將釋放生產力進行到底」。
1 月 20 日， MiniMax 揭開了其第二代智能體產品 ——MiniMax Agent 2.0 的面紗，為這個火熱的 AI 賽道添加了又一個生力軍。此次的更新被定義為了一個「AI 原生工作臺」（AI-native Workspace），從產品形態和能力分布上進行了深度重構。
這個全新的工作臺不再像過去那樣依賴簡單的 Chat 式對話框，而變身為能感知本地環境、自主拆解復雜任務且提供專家級專業技能的進階型智能協作伙伴。這些能力實現的背后立著以下三大核心支柱：
首先是桌面端應用「MiniMax Agent Desktop」，它讓 Agent 跳出了瀏覽器網頁，而能在操作本地文件和本地環境的同時啟動網頁自動化任務。這意味著，該 APP 實現了本地與云端之間的無縫連接，通過一個全局視角滲透到各個職能角色的核心工作流中，將人類從「在不同窗口間切換、復制粘貼、點擊按鈕」的重復勞動中解放出來。
MiniMax 桌面端已經上線了 Windows 和 Mac 雙版本。
其次是「Expert Agents」，打造垂直領域的頂級專家分身。 Expert Agents 超越了現有預設的 Multi-agent 的 Pro 模式，通過封裝私有知識和行業獨家 SOP（標準操作流程），用專家級的知識、能力和經驗儲備來武裝用戶。
MiniMax 表示， 1.0 時代依賴的 Multi-agent 多專家系統只能提供 70 分的通用專家組合，現在借助 Expert Agents 可以將這一分數拉升到 95 分甚至 100 分，可靠性有了質的提升。并且官方還會提供大量開箱即用的 Expert Agents ，降低了操作門檻，上手更輕松。
用戶現在可以在桌面和網頁雙端限時免費體驗 Expert Agents 功能。
最后定義自己的 Expert Agents ，通過更多的上下文信息和更自由的自定義設置，讓 Agent 在更懂你的基礎上提供個性化的專家服務。
如果說去年發布的 MiniMax Agent 1.0 定義了「靠譜的 AI 伙伴」，如今的 2.0 在同樣確保結果的準確性之外，在 AI 原生自動化執行的廣度、深度、專業度上來了波全方位加強。
一手實測：這個 Agent 真是能文能武
表現如何還得看實戰。打開 MiniMax Agent 官網，下載最新上線的 MiniMax 桌面端，即可開啟 AI 原生工作臺體驗，重塑工作流。

官網地址：https://agent.minimaxi.com/
安裝完成后，在引導界面可以看到 MiniMax 桌面端已經深度打通本地文件，我們只需選定一個工作目錄，即可讓 AI 讀取、分析、批量處理該目錄下的所有文件。這一設計體現了其打造「AI 原生工作臺」的核心思路。
下面就開始測試吧。
作為一家媒體，我們的日常工作中一大很重要的任務是刷選題，直接輸入下面的提示詞，看看我們能否在 MiniMax 桌面端中讓 Agent 自主實現這個定時任務，提升我們刷選題的效率。

每天 9:00 為我提供過去 24 小時內 AI 領域的重點新聞摘要。每條新聞提煉一個核心要點，并附帶網絡檢索來源，確保清晰易讀

4 倍速視頻
僅僅 2 分多鐘， MiniMax 的 Agent 就成功完成了任務，正確編寫了腳本并進行了可行性測試。不僅如此，該 Agent 還給出了后續實現定時任務的教程，讓我們只需一些復制粘貼，即可在我們的設備上將這個 AI 任務變成每天上午的日常。下圖總結了此次任務的執行結果：

而作為一家專業的人工智能媒體，讀論文也是我們的一個日常，接下來我們試了試讓 MiniMax 桌面端分析解讀 MiniMax-M1 背后的技術脈絡。

這是 MiniMax-M1 的技術報告 https://arxiv.org/pdf/2506.13585 ，研究其參考文獻，了解其背后的技術，然后制作一個網頁，展示 MiniMax-M1 背后的技術進化圖譜，務必盡量往前追溯。

很顯然，這個任務會更加復雜一些，耗時大概 6 分鐘。

4 倍速視頻
在執行過程中， Agent 首先分析了任務需求，然后調用工具下載了指定文檔，之后對文檔進行了分析解讀以及技術追溯。之后，它又按照要求編寫了一個網頁來進行了展示。
最后， MiniMax 的 Agent 為我們創建了這樣一個網頁，：

不僅如此，該 Agent 還自動在 MiniMax Space 上部署了這個網頁，讓我們可以直接使用和分享這個網頁：https://sqwu1jsy96cd.space.minimaxi.com/
這種從研讀到交付的閉環能力，展現了其在任務執行上的工程深度。
當然，得益于工作目錄的設計， MiniMax 桌面端不僅能處理單篇論文，更能直接處理一個裝滿文件的文件夾。舉個例子，我們的日常工作將會積累很多選題，其中包括一些高質量的技術博客，使用以下提示詞，我們可以讓 MiniMax 將這些博客從文檔中提取出去，并制作成精美的 PPT 進行展示。

這是我們近幾個月的日常選題整理文檔，請梳理出其中所有的技術博客，并訪問每篇技術博客的內容，給出簡短的內容整理。將結果整理成一個 PPT ，每一頁展示一篇技術博客，其中應包括一些引用自博客的圖片或截圖、博客標題和鏈接以及內容簡介。使用莫蘭迪色系。

這個任務就更加復雜了，而且非常繁瑣，也因此我們此前都沒去處理。而在 MiniMax 桌面端的幫助下，我們僅用 23 分鐘時間就完成了整個任務。

16 倍速視頻
可以看到，我們的初始文件是一大堆的 docx 文檔， MiniMax 桌面端首先調用工具將所有這些文檔轉換成了 LLM 最喜歡的 markdown 格式，然后讀取詳細內容，并提取出了分散在各個文檔中的技術博客。之后它繼續調用工具，讀取了文檔中這些技術博客鏈接的具體內容。之后它繼續推進，將這些內容總結成了適合制作 PPT 的文案，接下來，還是調用工具，它使用這些文案生成了圖像和演示 PPT 。
至于效果，可以說是超乎想象地好。

通過以上測試示例，我們看到了 MiniMax 桌面端在日常工作中對我們的強大助益，同時，我們也看到了將 Agent 接入本地計算機的無限可能性。
舉個例子，對以上視頻的加速處理，我們也完全是通過 MiniMax 桌面端完成的。而我們所做的，不過是輸入了這樣一段提示詞：

處理一下文件夾中的視頻：將 MiniMax-1 和 2 加速 4 倍，將 3 加速 8 倍，將 4 加速 16 倍。我本地已經安裝 ffmpeg 。

Agent 精準識別了本地環境中的工具路徑，并生成了對應的處理指令。無需用戶手動輸入復雜的命令行參數，視頻加速任務便在后臺安靜、高效地完成了。

最后，我們還簡單嘗試了 MiniMax 提供的專家 Agent 創建能力。據介紹，該功能「允許用戶構建在特定領域達到 95 分甚至 100 分的領域的專家 Agent 。不僅僅是簡單的 Prompt 調整，而是深度的知識與能力注入。」
創建過程非常簡單直觀。在對話框左下方選擇「子代理」→「管理子代理」，即可創建出可以多次復用的 Agent ，比如這里我們簡單創建了一些「專家」。而在每個 Agent 的配置中，我們也可以選擇啟動不同的工具。

之后，我們只需在開啟任務之前選擇我們想要使用的子代理，即可將相應的 Agent 納入到我們的工作流程中。比如在下面的例子中，我們啟用了上面配置的一系列專家，然后讓它們圍繞「AI 究竟是什么」進行了一系列深度探討。這時候， MiniMax 本身會化身這場多智能體討論的主持人，通過在探討中調用不同配置的子代理，實現對這一話題多視角反復深度討論。

這項能力具有巨大的想象空間。它意味著用戶可以將行業經驗、部門 SOP 甚至復雜的業務邏輯轉化為可調用的模塊。當用戶面對一項復合任務時，不再是與一個通用模型交談，而是指揮一支由特定領域專家組成的數字團隊。這種從「單點能力」向「專家協作」的轉變，為大模型在專業垂直場景的落地提供了更具實操性的路徑。
整體體驗下來，我們看到 MiniMax Agent 能夠理解復雜的 SOP 流程，自主調用本地與云端工具，將原本需要多款軟件協作的任務濃縮在單一的提示詞輸入框中。這種以任務完成率為核心的設計，正是 MiniMax 試圖定義的 AI 原生工作范式。
從刷分到會干活：MiniMax 正在重新定義 AI 能力邊界
總結來看， MiniMax Agent 2.0 并不是在展示它想得有多聰明，而是在證明它能把事做到哪一步。
在 Agent 2.0 的工作方式里， AI 不再等待人類一次次補充上下文，而是主動進入工作環境，理解你的文件、網頁、工作流程，持續推進任務本身。你只要給出一個指令，剩下的拆解、執行與跟進，交由 Agent 在 Workspace 中完成。
這也解釋了為什么 MiniMax 要把 Agent 2.0 定義為 AI-native Workspace 。
這背后，是 MiniMax 在模型層面的持續升級，以及一套在內部真實運轉的工作方式。
去年 6 月提出的 Lightning Attention 將長序列計算成本從二次方降為線性，讓 Agent 不再失憶；10 月發布的 M2 定位為 Agent & Code Native ，采用交錯思維機制和 MoE 架構（230B 總參數、10B 激活）， API 價格僅為 Claude Sonnet 4.5 的 8%；12 月的 M2.1 則向 Rust、Java、C++ 等后端語言深入，使得模型具備全棧工程能力。
而這些能力，首先被 MiniMax 自己用在了內部。模型被直接嵌入研發與辦公的核心流程，從寫代碼、拆需求到跑 Agent 任務。據了解，在過去數周內， MiniMax 內部接近 100% 的同學開始使用 Agent 實習生。
這樣一來，模型能力的每一次升級，都會在真實業務中被高頻使用和反復打磨，而內部產生的反饋，又返回到下一輪模型和系統設計上來，形成了一條快速自我強化的迭代閉環。
此次 MiniMax 定義的「AI 原生工作臺」將掀起一場對 AI 參與高復雜度工作的價值重構。其中一點是交互邏輯發生了變化，從「人要被動適應 Agent」變為「Agent 主動適應人」。另外通過定制化的 Expert Agents ，專業壁壘被打破，普通人無需經歷漫長的學習就能獲得行業頂級的知識與經驗。
【剛剛，MiniMax來承包你的桌面了】文中視頻鏈接：https://mp.weixin.qq.com/s/I2RgH04J2l5mG1x492T17A

推薦閱讀

上一篇：千億資本涌入！當貝耳機搶先布局，劍指 6 億臺出貨量

下一篇：上線兩個月千問C端月活躍用戶突破1億