类人机器人,即身体结构类似人体的机器人或虚拟系统,在现实世界中具有广泛的应用。它们的四肢和身体与人类相似,因此可以模拟各种人类动作,如行走、蹲伏、跳跃和游泳等。
(图片来源:arxiv.org)
通过计算生成虚拟类人形角色的真实动作,可能对开发电子游戏、动画电影、虚拟现实(VR)体验和其他媒体内容发产生有趣的影响。然而,电子游戏和动画中所描绘的环境往往是高度动态和复杂的,因此在这些环境中引入类人机器人的规划动作更具挑战性。
据外媒报道,以色列NVIDIA研究中心(NVIDIA Research)的研究人员最近推出新计算方法PlaMo(规划和移动,Plan and Move),可用于规划人形机器人在复杂的3D物理模拟世界中的移动方式。在arXiv预印本服务器上发表的一篇论文中介绍了这种方法,该方法由场景感知路径规划器和稳健的控制策略组成。
该论文中提到:“在复杂的物理模拟世界中控制类人机器人是一项长期挑战,在游戏、模拟和视觉内容创建中具有诸多应用。该设置给定一个丰富而复杂的3D场景,用户可以提供由目标位置和运动类型组成的指令列表。为了解决这个任务,我们提出了PlaMo,这是一款场景感知路径规划器和强大的物理基控制器。”
之前的大多数研究以规划类人角色在3D模拟环境中的运动为目标,重点关注开发规划器或控制器,而不是兼顾两者。由于这两种模型执行的任务(即规划和执行类人机器人的运动)是相互依存的,研究人员开始设计一种能够同时解决这两个问题的计算方法。
研究人员表示:“考虑到场景对运动施加的各种限制,例如位置、高度和速度,路径规划器会生成一系列运动路径。而与规划器相辅相成,我们的控制策略会根据规划生成丰富而逼真的物理运动。”
研究人员对PlaMo进行了一系列仿真测试,使用它来规划和执行SMPL类人机器人的运动,并在英伟达(NVIDIA)开发的物理基强化学习模拟环境IsaacGym上进行模拟运行。SMPL是一种具有中性身体结构的人形虚拟代理(即没有五官、头发和衣服等)。
这些测试得出的结果非常令人鼓舞。研究人员发现,PlaMo方法能够按照文本指令有效地规划和执行SMPL类人机器人在复杂模拟景观中的运动。值得一提的是,该方法的规划器组件能够处理人形角色在不平坦地形上的运动,以及环境中的静态和动态障碍物。反过来,运动控制器能够可靠地跟踪规划者规划的路径,为类人机器人执行复杂且具有场景感知的动作,例如在低悬天花板下爬行,或快速移动以避开接近的障碍物。总体而言,这两个模块结合在一起非常有效,可以根据环境变化产生真实的运动。
PlaMo专注于规划和控制,这为将其与现代语言模型和3D场景理解相结合开辟了机会。考虑到这些扩展内容,研究人员将PlaMo视为实现更大系统的敲门砖。在这些系统中,非玩家角色(NPC)被赋予要扮演的角色,从而形成丰富的模拟虚拟世界。