据外媒报道,加州大学伯克利分校(University of California, Berkeley)机器人专家团队报告称,通过使用模拟到真实(sim-to-real)的强化学习来训练机器人,可以训练机器人完成相对简单的任务。相关研究论文已发表于期刊《Science Robotics》。该研究小组训练了一个机器人在陌生的环境中行走,同时承载着各种负载,结果机器人均没有翻倒。
图片来源:加州大学伯克利分校
在过去的几年里,机器人专家使用了多种技术来训练机器人在不同的环境中高效、快速地移动。但正如这项新研究的研究人员指出的那样,此类机器人并没有太多有用的应用。研究人员认为,能够以缓慢但高效的方式执行日常任务的机器人会更有用。为此,他们转向了模拟到真实的强化学习。
通过在模拟环境中暴露于数十亿个示例,该技术涉及训练机器人的模拟版本来执行所需的任务。该方法还涉及使用奖励/惩罚系统作为机器人训练的一部分,例如,如果机器人在尝试实现目标时做得正确,则会获得“1”的奖励。然而,如果它做错就会收到“-1”。随着时间的推移,它会在寻求增加奖励数量时提高其性能。
研究小组使用这种方法训练了一个名为Digit的机器人,让它在城镇未知区域的人行道上行走,并在遭受大球反复攻击后恢复,以克服身体限制、走过可能导致绊倒的材料、携带背包、将一袋垃圾放入垃圾箱,以及使用手提袋携带个人物品。
研究人员建议,模拟到真实的强化学习可用于在家庭、办公室或工厂车间等现实环境中训练机器人,从而使让机器人更有用。