Databricks擴展AI智能體治理與評估工具

Databricks擴展AI智能體治理與評估工具

Databricks公司今天宣布對其Agent Bricks框架進行一系列更新 , 旨在提升企業AI智能體的治理、準確性和模型靈活性 。
這些公告是其\"AI智能體周\"的一部分 , 包括在MLflow開源平臺中用于管理機器學習生命周期的新功能、模型上下文協議服務器市場以及從文檔中提取結構化數據的工具 。
Databricks表示 , 這些更新旨在幫助企業將AI智能體從試點項目轉向生產環境 , 同時保持對數據訪問、模型使用和決策準確性的控制 。
此前專注于機器學習的MLflow平臺現在將支持AI智能體的評估和監控 。 Databricks AI和機器學習產品高級總監Craig Wiley表示:\"我們將大量評估能力開源到MLflow中 。 \"
評估框架對于希望部署智能體的組織至關重要 , 特別是在面向外部的環境中 。 AI模型評估確保智能體可靠、準確且值得信賴 , 還可能涵蓋公平性、偏見和穩健性等因素 。
可調節評估
更新后的框架允許用戶創建自定義評估邏輯 , 包括使用特定領域標準評估模型性能的可調節\"評判器\" 。 Wiley說:\"你可以提供自然語言反饋 , 我們會在后臺訓練評判器以更好地反映這種反饋 。 \"
用戶還可以導入或創建自己的評判器 , 或使用Databricks提供的開源版本 。 評判器可以評估測試集和實時生產推理 。
Databricks還推出了AI Gateway , 這是一個標準化模型訪問和監控方式的治理層 。 該網關可應用于OpenAI的GPT-5、谷歌的Gemini和Anthropic的Claude等專有模型 , 以及Llama和GPT-OSS等開源模型 。
Wiley說:\"Databricks上的任何大語言模型端點都可以使用AI Gateway進行治理 。 如果客戶給我們一個端點 , 我們會將治理原生模型的相同標準應用到該端點 。 \"
治理功能包括日志記錄、訪問控制、速率限制和審計跟蹤 , 通過Databricks的Unity Catalog執行 。 可以設置控制來限制使用以達到成本控制目的 。
MCP市場
對模型控制協議的支持允許AI智能體與第三方數據和服務安全交互 , 例如從You.com檢索上下文或使用Glean Technologies的搜索引擎分析客戶數據 。
例如 , Wiley說:\"You.com提供了最好的互聯網索引之一 。 他們可以讓智能體使用該索引 , 但繼續擁有他們期望從Databricks獲得的治理、訪問控制、監控和日志記錄 。 \"Wiley表示 , Databricks打算讓客戶需求驅動市場中MCP服務器的選擇 。
他說:\"如果有人具備我們客戶需要的功能 , 我們很樂意找到使其可用的方法 。 \"雖然合作伙伴在市場中列出產品沒有費用 , 但\"客戶調用某些MCP服務器是有成本的\" 。
目前處于測試階段的多智能體監督功能可以協調多個智能體和MCP服務器的工作流程 。 Databricks表示 , 這允許智能體采取自動化操作 , 如創建支持工單或運行SQL查詢 , 同時通過Unity Catalog維持治理 。
強化版OCR
為了幫助智能體訪問文檔中鎖定的知識 , Databricks還推出了ai_parse_document , 這是一個從PDF和表格中提取結構化數據的SQL函數 。 作為一種強化版光學字符識別引擎 , 該函數將非結構化內容轉換為Unity Catalog中的受治理、可搜索數據 。
Wiley說:\"它不僅識別或翻譯文本 , 還將文檔分塊以便在向量數據庫中使用\" , 從而能夠用于檢索增強生成和其他智能體工作流程 。 客戶可以使用Databricks的信息提取模塊提取、細化和標記信息 , 該模塊可以識別合同條款或個人標識符等實體 。
Wiley表示 , Databricks專注于幫助組織在高風險應用中部署AI智能體 , 在這些應用中治理和評估至關重要 。 他說:\"我們的目標是幫助組織將這些智能體應用到風險和高價值用例中 。 \"
新功能從今天開始提供 , 部分功能處于測試版或公開預覽階段 。
Q&A
Q1:Databricks的AI Gateway是什么?它有什么作用?
A:AI Gateway是Databricks推出的治理層 , 用于標準化模型的訪問和監控方式 。 它可以應用于OpenAI的GPT-5、谷歌的Gemini等專有模型 , 以及開源模型 。 治理功能包括日志記錄、訪問控制、速率限制和審計跟蹤 。
Q2:MLflow平臺現在支持哪些新功能?
A:MLflow平臺現在支持AI智能體的評估和監控 。 更新后的框架允許用戶創建自定義評估邏輯 , 包括可調節的\"評判器\"來評估模型性能 。 用戶可以提供自然語言反饋 , 系統會訓練評判器更好地反映這種反饋 。
Q3:ai_parse_document函數能做什么?
A:ai_parse_document是一個SQL函數 , 可以從PDF和表格中提取結構化數據 。 它不僅能識別和翻譯文本 , 還能將文檔分塊以便在向量數據庫中使用 , 支持檢索增強生成和其他智能體工作流程 。
【Databricks擴展AI智能體治理與評估工具】

    推薦閱讀