
文章圖片

文章圖片

文章圖片

文章圖片

不圓 發自 凹非寺
量子位 | 公眾號 QbitAI
英偉達也做深度研究智能體了 。
最新論文介紹了英偉達的通用深度研究(UDR)系統 , 該系統支持個人定制 , 可接入任何大語言模型(LLM) 。
這意味著它能夠圍繞任何語言模型運行 , 用戶可以完全自定義深度研究策略 , 并交給智能體實現 。
為展示其通用性 , 英偉達還為UDR配備了帶用戶界面的研究演示原型 , 可在GitHub上下載 。
網友認為 , 它使智能體的自主性得到了突破 , 非常適合企業工作 。
自帶模型和策略論文介紹 , 以往推出的所有深度研究智能體 , 都采用硬編碼方式 , 僅能通過固定的工具選擇來執行特定研究策略 。
而英偉達的UDR系統能夠圍繞任何LLM運行 。
還能使用戶能夠在無需額外訓練或微調的情況下 , 創建、編輯和優化他們完全自定義的深度研究策略 。
上圖呈現的是一個典型深度研究工具(DRT)的組成部分 , 與普通的對話式LLMs不同 , DRTs在生成報告之前傾向于持續向用戶更新其進度 。
一個DRT由兩部分組成:
一個簡單的用戶界面:用于接收研究提示 , 持續向用戶更新研究進度 , 并顯示研究報告; 代理邏輯:代碼代理(通過代碼協調大語言模型與工具的組合運用)或LLM代理(直接利用模型自身的推理和工具調用能力) 。無論是Gemini、Perplexity還是OpenAI , 現有的DRTs主要采用僵化的研究策略 , 除研究提示詞外幾乎不留用戶定制空間;而在具有LLM代理的DRTs中 , 往往存在底層模型選擇單一、或僅使用訓練后行為特征相同的同系列模型的問題 。
雖然這個問題并不是阻礙DRTs廣泛流行的障礙 , 但它從三個方面限制了它們的實用性:
1、用戶既不能自主設置資源優先級 , 也無法自動驗證信息的權威性 , 更無法控制搜索成本 。 2、現有的DRTs做不出高價值行業需要的專業文檔分析方案 。 3、現有的DRTs使用的模型是不可換的——用戶不能隨意將最新或最強大的模型與深度研究智能體組合起來 , 以產生一個更強大的DRT 。而英偉達的UDR系統提出了一種通用的解決方案來解決上述問題 。
簡單地說 , 與專門的DRT不同 , UDR從用戶那里接收研究策略和研究提示 , 允許更高的定制程度 。
UDR能夠將策略從自然語言編譯成可執行的研究編排代碼片段 , 然后執行策略 , 并將最終報告交付給用戶 。
其最顯著的創新特性包括:
通過自然語言定制研究策略 。 UDR支持用戶用自然語言定義和編程自己的研究工作流 , 系統會將其轉換為可執行、可審計的代碼 。
這意味著用戶自己設計的智能操作流程 , 不需要重新訓練AI模型或進行復雜調試 , 就能直接投入實際使用 。
與模型無關的研究工具架構 。 UDR將研究邏輯與語言模型解耦 , 使開發者能夠將任何大語言模型——無論供應商或架構如何——封裝成功能完整的深度研究工具 。
這樣一來 , 產品設計就有了更大發揮空間:既能選用最先進的AI模型 , 又能搭配量身定制的研究方案 , 實現靈活組合的創新應用 。
用戶可控的策略驅動研究界面 。 下圖的原型展示了四大實用功能:實時修改研究策略、選擇預設策略庫、接收進度通知、查看分析報告 。
UDR通過區分控制邏輯和語言模型推理來提升計算效率:整個深度研究流程的調度由生成的代碼全權負責 , 這些代碼直接在CPU上運行 , 避免了成本高出數十倍的語言模型推理開銷 。
系統僅在用戶自定義研究策略明確要求時才會調用LLM , 且每次調用僅處理代碼變量中存儲的精簡定向文本片段 。
這種雙重高效設計——將流程調度交給CPU執行邏輯 , 同時將LLM的使用嚴格限定在精準高效的調用中——不僅能夠降低GPU資源消耗 , 還可以顯著減少深度研究任務的總體執行延遲和成本 。
仍需進一步探索不過 , 這項工作目前還存在一定的局限性 。
一方面 , UDR系統執行研究策略的準確度 , 完全取決于底層AI模型生成代碼的質量 。 雖然研究人員通過強制要求代碼添加注釋來減少錯誤 , 但當策略表述模糊或不夠具體時 , 系統偶爾還是會產生理解偏差或邏輯錯誤 。
另一方面 , UDR默認用戶設計的研究策略本身是合理且可執行的 。 系統只會做基礎檢查 , 不會判斷策略步驟是否真正有效 。 如果策略設計得不好 , 最終生成的報告可能質量低下、內容不全 , 或者根本生成不出報告 。
此外 ,還有一點在于 , 雖然UDR會實時顯示研究進度 , 但當前版本在執行過程中不支持用戶干預(只能停止任務) , 也無法根據實時反饋調整研究方向 。
所有決策都需要在研究開始前就預先設定好 , 這使得長時間或探索性的研究任務缺乏靈活性 。
針對上述問題 , 研究人員也提出了進一步的解決方案——或者說改進方案:
比如配備可修改定制的研究策略庫、進一步探索如何讓用戶控制語言模型的自由推理過程、將大量用戶提示自動轉化為確定性控制的智能體等 。
目前英偉達的UDR系統還只是原型階段 , 并未正式推出 , 但或許可以期待一下 。
期待一個功能完整的正式版本 。
參考鏈接:[1
https://x.com/rohanpaul_ai/status/1964689864244203596[2
https://research.nvidia.com/labs/lpr/udr/[3
https://github.com/NVlabs/UniversalDeepResearch
— 完 —
量子位 QbitAI · 頭條號
【英偉達推出通用深度研究系統,可接入任何LLM,支持個人定制】關注我們 , 第一時間獲知前沿科技動態簽約
推薦閱讀
- 英偉達的局:15億美元,從Lambda那租到了搭載自家AI芯片服務器
- 高通CEO:高通處理器Intel造不了 技術不達標
- OpenAI宣布推出AI在線招聘平臺,和微軟的領英打起來了
- 對抗英偉達?20多家國產廠商合力,打造“中國CUDA”
- 國產Air率先登場!傳音推出兩款超薄新機,這次不再是概念機了
- 英偉達風投部門入股量子計算公司
- 英偉達獨顯游戲本用戶注意 免費提升性能的方法來了
- 英偉達老黃收購了一家AI編程公司
- 中國控股企業使用Claude遭禁 智譜:推出“搬家計劃”
- 英偉達擬將Rubin處理器CoWoS中間基板材料替換為碳化硅
