谷歌讓AI更易獲取真實世界數據

谷歌讓AI更易獲取真實世界數據

谷歌正在將其龐大的公共數據寶庫轉化為AI的金礦 , 推出了數據共享模型上下文協議(MCP)服務器 , 使開發者、數據科學家和AI智能體能夠通過自然語言訪問真實世界的統計數據 , 從而更好地訓練AI系統 。
谷歌數據共享平臺于2018年推出 , 整合了來自政府調查、地方行政數據以及聯合國等全球機構統計數據等各種來源的公共數據集 。 隨著MCP服務器的發布 , 這些數據現在可以通過自然語言訪問 , 讓開發者能夠將其集成到AI智能體或應用程序中 。
AI系統通常使用嘈雜、未經驗證的網絡數據進行訓練 。 再加上它們在缺乏來源時\"填補空白\"的傾向 , 這會導致產生幻覺 。 因此 , 希望針對特定用例對AI系統進行微調的公司往往需要獲取大量高質量數據集 。 通過公開發布數據共享的MCP服務器 , 谷歌旨在解決這兩個挑戰 。
數據共享的新MCP服務器連接了從人口普查數據到氣候統計等公共數據集與日益依賴準確結構化上下文的AI系統 。 通過使這些數據可以通過自然語言提示訪問 , 此次發布旨在讓AI建立在可驗證的真實世界信息基礎上 。
\"模型上下文協議讓我們能夠利用大語言模型的智能 , 在正確的時間選擇正確的數據 , 而無需了解我們如何建模數據或API如何工作 , \"谷歌數據共享負責人Prem Ramaswami在采訪中表示 。
MCP最初由Anthropic于去年11月推出 , 是一個開放的行業標準 , 使AI系統能夠從各種來源訪問數據 , 包括商業工具、內容存儲庫和應用開發環境 , 為理解上下文提示提供了通用框架 。 自推出以來 , OpenAI、微軟和谷歌等公司都采用了這一標準 , 將其AI模型與各種數據源整合 。
當其他科技公司探索如何將該標準應用于其AI模型時 , Ramaswami和他在谷歌的團隊在今年早些時候開始研究如何使用該框架讓數據共享平臺更易訪問 。
谷歌還與ONE Campaign合作推出了ONE數據智能體 , 這是一個專注于改善非洲經濟機會和公共衛生的非營利組織 。 這個AI工具利用MCP服務器以簡明語言呈現數千萬個金融和健康數據點 。
ONE Campaign向谷歌數據共享團隊提出了在其自定義服務器上實現MCP的原型 。 Ramaswami告訴TechCrunch , 這次互動是促使團隊在5月構建專用MCP服務器的轉折點 。
然而 , 這種體驗并不局限于ONE Campaign 。 數據共享MCP服務器的開放性使其與任何大語言模型兼容 , 谷歌為開發者提供了多種入門方式 。 通過智能體開發工具包(ADK)在Colab筆記本中提供了示例智能體 , 服務器也可以通過Gemini CLI或使用PyPI包的任何MCP兼容客戶端直接訪問 。 GitHub存儲庫中還提供了示例代碼 。
Q&A
Q1:什么是谷歌數據共享MCP服務器?
A:谷歌數據共享MCP服務器是基于模型上下文協議的服務器 , 它能讓開發者、數據科學家和AI智能體通過自然語言訪問真實世界的統計數據 , 包括政府調查、聯合國等機構的公共數據集 。
【谷歌讓AI更易獲取真實世界數據】Q2:MCP服務器如何解決AI訓練中的幻覺問題?
A:AI系統常用嘈雜、未驗證的網絡數據訓練 , 容易產生幻覺 。 MCP服務器通過提供高質量、可驗證的真實世界數據 , 讓AI建立在準確的結構化信息基礎上 , 從而減少幻覺現象 。
Q3:開發者如何使用谷歌數據共享MCP服務器?
A:開發者可以通過多種方式使用 , 包括在Colab筆記本中使用智能體開發工具包的示例智能體 , 通過Gemini CLI直接訪問 , 或使用PyPI包的任何MCP兼容客戶端 , GitHub上還提供了示例代碼 。


    推薦閱讀