DeepMind推出RoboBallet:讓制造機器人實現自主協調的AI系統

DeepMind推出RoboBallet:讓制造機器人實現自主協調的AI系統

今天我們使用的許多產品主要由機器人制造——具有多個自由度的機械臂沿著傳送帶精確同步運動 。 這些運動通常需要人工編程 , 耗時數百到數千小時 。 谷歌DeepMind團隊開發了一個名為RoboBallet的AI系統 , 讓制造機器人能夠自主決定如何完成工作 。
規劃制造機器人如何高效完成工作是一個極難自動化的問題 。 你需要同時解決任務分配和調度問題——決定哪個機器人以什么順序完成哪項任務 。 這就像加強版的著名旅行商問題 。 此外 , 還有運動規劃問題;你需要確保所有機械臂不會相互碰撞或與周圍設備發生碰撞 。
最終 , 你面對的是無數種可能的組合 , 需要同時解決三個計算上的難題 。 \"有一些工具可以自動化運動規劃 , 但任務分配和調度通常需要手動完成 , \"谷歌DeepMind研究工程師Matthew Lai說道 。 \"同時解決這三個問題就是我們在工作中要解決的挑戰 。 \"
Lai的團隊首先生成被稱為工作單元的模擬樣本 , 這是機器人團隊對制造產品執行任務的區域 。 工作單元包含一個工件——機器人要處理的產品 , 在這種情況下是放在桌子上由鋁支柱構成的結構 。 桌子周圍最多有八個隨機放置的Franka Panda機械臂 , 每個都有7個自由度 , 需要在工件上完成多達40個任務 。 每個任務都要求機械臂的末端執行器在正確的角度接近正確支柱上的正確位置 , 距離不超過2.5厘米 , 然后停留片刻 。 這個暫停模擬了實際工作過程 。
為了增加難度 , 團隊在每個工作單元中隨機放置了機器人必須避開的障礙物 。 \"我們選擇最多使用八個機器人 , 因為這大約是在不讓機器人頻繁互相阻擋的情況下緊密配合的合理上限 , \"Lai解釋道 。 強制機器人在工件上執行40個任務也被團隊認為代表了真實工廠的要求 。
即使使用最強大的強化學習算法 , 這樣的設置也是噩夢般的挑戰 。 Lai和同事們通過將所有內容轉換為圖形找到了解決辦法 。
Lai模型中的圖形由節點和邊組成 。 機器人、任務和障礙物等都被視為節點 。 它們之間的關系被編碼為單向或雙向邊 。 單向邊連接機器人與任務和障礙物 , 因為機器人需要了解障礙物位置以及任務是否完成 。 雙向邊連接機器人彼此 , 因為每個機器人都必須知道其他機器人在每個時間步驟的行為 , 以避免碰撞或重復任務 。
為了讀取和理解圖形 , 團隊使用了圖神經網絡 , 這是一種專門設計用于通過沿連接邊傳遞消息來提取節點間關系的人工智能 。 這簡化了數據 , 使研究人員能夠設計一個專注于最重要事項的系統:找到在避開障礙物的同時完成任務的最高效方式 。 在使用單個Nvidia A100 GPU對隨機生成的工作單元進行幾天訓練后 , 這個名為RoboBallet的新工業規劃AI能夠在幾秒鐘內為復雜的、以前從未見過的環境規劃出看似可行的軌跡 。
最重要的是 , 它的擴展性非常好 。
將傳統計算方法應用于管理工廠機器人等復雜問題的困難在于 , 計算挑戰隨著系統中項目數量的增加而呈指數級增長 。 計算一個機器人的最優軌跡相對簡單 。 對兩個機器人做同樣的事情要困難得多;當數量增長到八個時 , 問題就變得幾乎無法解決了 。
使用RoboBallet , 計算復雜性也隨著系統復雜性增長 , 但速度要慢得多 。 (計算隨著任務和障礙物數量的增長呈線性增長 , 隨著機器人數量呈二次方增長 。 )據團隊介紹 , 這些計算應該使系統在工業規模使用中可行 。
然而 , 團隊想要測試他們的AI產生的計劃是否有效 。 為了驗證這一點 , Lai和同事們在幾個簡化的工作單元中計算了最優任務分配、調度和運動 , 并與RoboBallet提供的結果進行比較 。 在執行時間方面——可以說是制造業中最重要的指標——AI非常接近人類工程師的表現 。 它并不比他們更好——只是提供答案更快 。
團隊還在四個Panda機器人處理鋁工件的真實物理設置上測試了RoboBallet計劃 , 效果與模擬中一樣好 。 但Lai說它能做的不僅僅是加速機器人編程過程 。
根據DeepMind團隊的說法 , RoboBallet還能幫助我們設計更好的工作單元 。 \"因為它工作速度很快 , 設計師幾乎可以實時嘗試不同的布局以及不同的機器人放置或選擇 , \"Lai說 。 這樣 , 工廠的工程師就能準確看到通過向單元添加另一個機器人或選擇不同類型的機器人能節省多少時間 。 RoboBallet能做的另一件事是即時重新編程工作單元 , 當其中一個機器人故障時讓其他機器人填補空缺 。
盡管如此 , 在RoboBallet能夠進入工廠之前 , 仍有一些問題需要解決 。 \"我們做了幾個簡化 , \"Lai承認 。 首先是障礙物被分解為長方體 。 甚至工件本身也是立方體的 。 雖然這在某種程度上代表了真實工廠中的障礙物和設備 , 但有很多可能的工件具有更有機的形狀 。 \"最好以更靈活的方式表示這些 , 比如網格圖或點云 , \"Lai說 。 然而 , 這可能意味著RoboBallet驚人速度的下降 。
另一個問題是Lai實驗中的機器人是相同的 , 而在真實世界的工作單元中 , 機器人團隊通常是異構的 。 \"這就是為什么真實世界的應用需要針對特定應用類型進行額外研究和工程開發 , \"Lai說 。 不過他補充說 , 當前的RoboBallet已經設計時考慮了這樣的適應性——可以輕松擴展以支持它們 。 一旦完成這些 , 他希望這將使工廠更快、更靈活 。
\"系統需要獲得工作單元模型、工件模型以及需要完成的任務列表——基于這些 , RoboBallet將能夠生成完整計劃 , \"Lai說 。
Q&A
Q1:RoboBallet是什么?它能解決哪些問題?
A:RoboBallet是谷歌DeepMind開發的AI系統 , 專門用于制造機器人的自主協調 。 它能同時解決任務分配、調度和運動規劃三個難題 , 讓制造機器人自主決定如何高效完成工作 , 避免傳統需要數百到數千小時人工編程的問題 。
Q2:RoboBallet如何處理多機器人協調問題?
A:RoboBallet將機器人、任務和障礙物轉換為圖形結構 , 使用圖神經網絡分析節點間關系 。 通過單向和雙向邊連接 , 機器人能了解障礙物位置、任務狀態和其他機器人行為 , 從而避免碰撞和重復任務 , 實現高效協調 。
Q3:RoboBallet的擴展性如何?能應用到實際工廠嗎?
A:RoboBallet具有良好的擴展性 , 計算復雜性隨任務和障礙物線性增長 , 隨機器人數量二次方增長 , 遠優于傳統方法的指數增長 。 團隊已在真實四機器人設置中驗證其有效性 , 但仍需解決異構機器人和復雜形狀工件等問題才能全面工廠應用 。
【DeepMind推出RoboBallet:讓制造機器人實現自主協調的AI系統】

    推薦閱讀