Popular science work
據美國麻省理工學院官網近日報道,該機構研究人員為了訓練更先進的多用途機器人,開發出一種技術:使用一種稱為擴散模型的生成式人工智能(AI),可將不同領域、不同形式的多個數據源整合起來,用于多種任務。
假設你想訓練一個機器人,讓它了解如何使用工具,然后快速學會用錘子、扳手和螺絲刀來維修你的房子。為此,你需要大量數據來演示工具的使用。
現有的機器人數據集在形式上差異很大。例如,有些包括彩色圖像,而另一些則由觸覺印記組成。數據也可在不同的領域收集,如模擬或人工演示。每個數據集都可能包含一個獨特的任務和環境。
在一個機器學習模型中,很難有效地將眾多來源的數據整合在一起,因此許多模型僅使用一種類型的數據來訓練機器人。但是,以這種方式訓練的機器人,在某些特定任務方面的數據相對較少,通常無法在不熟悉的環境中執行新任務。
研究人員此次改變策略,訓練了一個單獨的擴散模型,讓它學習使用一個特定數據集來完成一項任務。然后,他們將擴散模型的學習策略組合成一個通用策略,使機器人能在各種設置中執行多項任務。
在模擬和真實世界的實驗中,這種訓練方法使機器人能使用多種工具,并適應訓練期間沒有學過的新任務。與基線技術相比,這種策略組合將任務性能提高了20%。
研究人員表示,解決機器人數據集中的異質性就像一個先有雞還是先有蛋的問題。如果想使用大量數據來訓練通用機器人,首先需要可部署的機器人來獲取所有這些數據。利用所有可用的異質數據,類似于研究人員對ChatGPT所做的工作,是機器人領域發展的重要一環。