集成机械手的四足机器人可以处理需要在周围环境中快速移动的同时操纵物体的任务。这些任务包括收集房屋周围的垃圾、收集特定物品并将其带给人类或将目标物品放置在特定位置等。
许多旨在训练机器人成功完成任务的方法都依赖于模仿学习。这意味着规划机器人动作的算法会学习策略,这些策略将允许机器人通过处理演示数据来完成任务,演示数据展示了代理如何完成这项任务。
虽然一些现有的训练机器人完成涉及运动和物体操纵任务的方法在模拟中取得了可喜的成果,但它们在“野外”的表现往往并不理想。这实际上意味着,在现实环境中进行测试时,它们无法让机器人很好地概括各种任务。
图片来源:加州大学
据外媒报道,加州大学圣地亚哥分校(UC San Diego)的研究人员最近推出可以提高野外四足机器人长距离操纵技能的新框架WildLMa,其三个组件可以共同提高通过模仿学习所学技能的通用性。相关论文已发表于arXiv预印本服务器上。
“模仿学习的快速进步使机器人能够从人类的示范中学习,”论文作者Yuchen Song表示。“然而,这些系统通常专注于孤立的特定技能,它们很难适应新环境。我们的工作旨在克服这一限制,通过使用视觉语言模型(VLM)训练机器人获得可推广的技能,然后利用大型语言模型(LLM)将这些技能链接成序列,使机器人能够处理复杂的任务。”
Song及其同事设计的框架WildLMa首先提供了一种收集专家演示数据的简单方法。这是通过基于虚拟现实(VR)的远程操作系统实现的,其中人类代理可以利用预先训练的机器人控制算法,只用一只手来控制机器人的整个身体运动。
“这些预先训练的技能随后通过LLM得到增强,LLM将复杂的任务分解为可管理的步骤——类似于人类应对挑战的方式(例如,‘挑选 - 导航 - 放置’),”Song 解释说。“结果是机器人能够高效、直观地执行长时间、多步骤的任务。”
该研究团队介绍的方法的一个显著特点是它还集成了注意力机制。这些机制允许机器人在完成特定任务时专注于目标对象。
“注意力机制的集成在使机器人的技能更具适应性和可推广性方面起着关键作用,”Song补充说。“WildLMa的潜在应用包括实际的家务,例如整理或取回物品。我们已经展示了其中一些功能。”
Song及其同事已经在一系列真实世界的实验中展示了该框架的潜力,成功地训练了一个四足机器人完成各种任务。这些任务包括清理加州大学圣地亚哥分校走廊和室外空间的垃圾、取外卖以及重新整理书架上的物品。
“虽然我们的系统表现良好,但它仍然会受到意外干扰的影响,例如人们四处走动,”Song补充道。“我们的下一步将涉及使系统在动态环境中更加稳健。最终,我们的目标是创造人人都能负担得起且可以使用的家庭助理机器人。”