產經情報

DeepMind釋出可改進機器人堆疊物體能力的基準測試RGB-Stacking

日期:2021-10-14

DeepMind所發布的RGB-Stacking基準測試,提供技能掌握以及技能泛化兩種難度的堆疊任務,而DeepMind的機器人已經可以在真實世界的技能掌握任務,達到82%的成功率

Google旗下的人工智慧研究組織DeepMind,發表了最新的機器人物體堆疊任務RGB-Stacking,其提供基於電腦視覺技術的機器人一個測試基準,在這個基準測試中,機器人需要學習抓住不同物體,並且使物體保持平衡地堆疊在一起。DeepMind希望藉由這個基準測試,促進機器人的研究,增進機器人操作物體的能力。

研究人員提到,與之前的研究不同之處在於,RGB-Stacking使用更多樣的物體,並且經過大量實驗來驗證他們的發現,而他們的結果也顯示,模擬和現實世界資料的組合,有助於機器人學習複雜的多物體操作,並且泛化解決新物體問題。

在RGB-Stacking基準測試中,有一個放著紅色、綠色和藍色物體的籃子,籃子的上方有一個搭載夾具的機械手臂,而RGB-Stacking的任務,是要機器人在20秒內,將紅色物體堆疊到藍色物體的上方,而綠色物體則是充當障礙物,混淆機器人的判斷,藉由多變化的堆疊和抓握方式,迫使機器人必須要表現出更複雜的拾取和放置行為。

RGB-Stacking基準測試擁有兩個不同難度的任務,目標分別為技能掌握以及技能泛化,技能掌握的目標是要讓機器人能夠熟練的堆疊物體,而技能泛化則是要讓機器人,具有堆疊未曾見過物體的能力。

RGB-Stacking的目標是要以增強學習,訓練機器手臂來堆疊不同形狀的物體,研究人員借助模擬器得以快速訓練,並且藉由一步策略來改進機器人在真實世界的操作。在技能掌握上,DeepMind的機器人在模擬世界擁有79%的成功率,在真實機器人上實現了68%的成功率;而經使用真實資料改進的一步策略,達到了82%;而技能泛化,在真實機器人上獲得54%的成功率。

研究人員提到,近年來學習演算法已經大規模解決困難的機器人操作問題,但這些研究重點,集中在抓取、推動和其他形式的單物體操作任務,而RGB-Stacking則是要讓機器人掌握複雜的多物體堆疊技巧。不過,縮短技能掌握和技能泛化的差距,仍然是一大挑戰。

研究人員開源了RGB-Stacking相關的研究資源,希望有助於其他人員的研究,包括模擬環境,以及用來建構真實機器人的RGB-Stacking環境設計,還有能夠3D列印出RGB物體模型的資訊,同時廣泛地開源機器人研究中一系列函式庫和工具。