- 型號:KUC711AE101?3BHB004661R0101
- 數(shù)量:5
- 制造商:廈門戎豐電氣設備有限公司
- 有效期:2025/1/9 0:00:00
谷歌為人工智能機器人開發(fā)了一部“機器人憲法”,讓機器人不傷害人類。
當?shù)貢r間1月4日,谷歌DeepMind機器人團隊公布了三項新進展,稱這些進展將幫助機器人在自然環(huán)境中做出更快、更好、更安全的決策。其中一項進展是一個收集訓練數(shù)據(jù)的“機器人憲法”系統(tǒng)——AutoRT。
谷歌的數(shù)據(jù)收集系統(tǒng)AutoRT利用了基礎大模型的潛力,有助于開發(fā)能夠理解人類實際目標的機器人。它通過收集數(shù)據(jù)幫助擴展機器人學習,從而更好地訓練機器人適應現(xiàn)實世界。
AutoRT結(jié)合了視覺語言模型(VLM)、大語言模型(LLM)以及機器人控制模型(RT-1或RT-2),讓機器人在新環(huán)境中收集訓練數(shù)據(jù)。AutoRT可一次性安全指揮20個機器人,機器人只配備一個攝像頭、機械臂和移動基座,每個機器人利用視覺語言模型來了解其周圍環(huán)境和視線內(nèi)的物體,大語言模型則會提出一系列機器人可以執(zhí)行的創(chuàng)造性任務,比如把零食放在臺面上,或者扮演決策者為機器人選擇合適的任務。
盡管AutoRT是一個數(shù)據(jù)收集系統(tǒng),但它具有安全護欄,其中之一就是提供“機器人憲法”。谷歌的“機器人憲法”采用“以安全為重點的提示”,指示大語言模型避免選擇涉及人類、動物、尖銳物體甚至電器的任務。這部“機器人憲法”的靈感來自科幻作家艾薩克·阿西莫夫(Isaac Asimov)的“機器人三定律”,即機器人不得傷害人,也不得見人受傷害而袖手旁觀;機器人應服從人的一切命令,但不得違反第一定律;機器人應保護自身安全,但不得違反第一、第二定律。為了提高安全性,DeepMind對機器人進行編程,如果機器人關節(jié)受力超過一定閾值就會自動停止,并安裝了一個物理終止開關,讓人類操控機器人停止工作。
在七個月時間里,谷歌在不同辦公大樓中共部署52個獨特的機器人,收集了包括6650個獨特任務的77000次機器人試驗的不同數(shù)據(jù)集。據(jù)The Verge報道,一些機器人由人類操作員遠程控制,而其他機器人則根據(jù)腳本或完全自主使用谷歌的機器人Transformer(Robotic Transformer)人工智能學習模型進行操作。
DeepMind的其他新技術(shù)還包括神經(jīng)網(wǎng)絡架構(gòu)SARA-RT,旨在讓現(xiàn)有的機器人Transformer人工智能學習模型更快更準確。此外還宣布了RT-Trajectory模型,幫助機器人更好地完成擦桌子等特定物理任務。
對人類來說,理解如何擦桌子是一種直覺,但機器人可以通過多種方式將指令轉(zhuǎn)化為實際的物理動作。傳統(tǒng)上,訓練機械臂依賴于將抽象的自然語言(如擦桌子)映射到特定動作,例如閉合抓手、向左移動、向右移動,但這使得模型很難推廣到新的任務中。
而RT-Trajectory模型可以在訓練視頻中自動添加描述機器人運動的視覺輪廓。RT-Trajectory在訓練數(shù)據(jù)集中采集每個視頻,并將其與機器人手臂抓手執(zhí)行任務時的2D軌跡草圖疊加。這些軌跡為模型學習機器人控制策略提供了低級實用的視覺提示。
DeepMind表示,相比之下,RT-Trajectory模型能夠通過解釋視頻或草圖中包含的特定機器人動作讓機器人理解“如何做”任務。該系統(tǒng)用途廣泛,它還可以通過觀看人類演示任務來創(chuàng)建軌跡,甚至可以接受手繪草圖,它也可以輕松適應不同機器人平臺。
- 電話:13358378970
- 傳真: 0592-2231522
- email:3073759694@QQ.COM