首页 Metaverse 加州大学伯克利分校发布多功能控制系统,利用生成式AI让人形机器人更好地适应未知环境
加州大学伯克利分校发布多功能控制系统,利用生成式AI让人形机器人更好地适应未知环境

加州大学伯克利分校发布多功能控制系统,利用生成式AI让人形机器人更好地适应未知环境

  近日,据海外媒体报道,加州大学伯克利分校(University of California, Berkeley)的研究人员发明了一种多功能控制系统,这一系统能够使人形机器人熟练地通过各种地形和障碍物。据悉,这一系统是从大语言模型的深度学习框架中汲取灵感,其依赖于一个简单的原则:研究最近的观察结果可以帮助预测未来的状态和行为。

  该系统完全是在模拟中训练的,但在不可预测的现实环境中表现出稳健的性能。通过分析其过去的交互,人工智能动态地改进人形机器人的行为,以有效地处理它在训练阶段从未遇到过的新场景。

打造适用于所有地形的机器人

  按照人类形象设计的类人机器人有望有朝一日成为有价值的助手,它们能够导航世界,帮助完成各种身体的和认知方面的任务。然而,制造多功能人形机器人面临许多挑战,包括创建灵活的控制系统。

  机器人中的传统控制系统往往不灵活,通常是为特定任务设计的,无法应对现实世界地形和视觉条件的不可预测性。这种刚性限制了它们的实用性,将它们限制在受控环境中。

  因此,人们对基于机器学习的机器人控制方法越来越感兴趣。这些控制系统可以根据从模拟中收集的数据或与环境的直接交互动态调整机器人的行为。加州大学伯克利分校的研究人员发明的新控制系统有望轻松地引导人形机器人通过不同的地形和环境情况。该系统部署在全尺寸通用人形机器人Digit上,展示了出色的户外行走能力,可以在人行道、跑道和开阔场地等日常人类环境中进行可靠的导航。机器人的适应性也扩展到了处理各种地形,包括混凝土、橡胶和草地,而不会摔倒。

  研究人员表示,我们发现我们的机器人能够在所有测试的地形上可靠地行走,并且在没有安全龙门的情况下很舒服地对其进行部署。事实上,在为期一周的户外全天测试中,我们没有观察到任何机器人跌倒的情况出现。

通过新的人工智能来控制机器人

  虽然有几个类人机器人已经取得令人印象深刻的成就,但这个新系统的有趣之处在于训练和部署人工智能模型的过程。控制模型在基于高性能GPU的物理仿真环境Isaac Gym中进行了数千个域和数百亿个场景的纯仿真训练。然后,这种广泛的模拟体验被转移到现实世界,而不需要进一步的微调,这个过程被称为模拟到真实的转移。值得注意的是,该系统在实际操作中展示了应急能力,处理复杂的场景,如导航步骤,这在训练中没有明确涵盖。

  这个系统的核心是一个“causal transformer”,这是一个深度学习模型,可以处理本体感觉观察和行为的历史。这种causal transformer擅长识别特定信息的相关性,比如步态模式和接触状态,以及机器人的观察结果。

  Transformers以其在大语言模型中的有效性而闻名,它具有在大量数据序列中预测后续元素的天生能力。这里使用的causal transformer擅长从一系列观察和行动中学习,使其能够高精度地预测行动的后果,并修改其行为以获得更有利的未来状态。这就是它如何根据环境动态调整自己的行动,即使它之前没有遇到过。

  研究人员表示:“我们假设,观察和行动的历史隐含地编码了关于世界的信息,强大的transformer模型可以利用这些信息在测试时动态地调整其行为。”这个概念,他们称之为“上下文适应”,反映了语言模型如何使用它们相互作用的上下文来动态地学习新的任务,并在推理过程中动态地改进它们的输出。

  与其他序列模型(如时间卷积网络TCN和长短期记忆网络LSTM)相比,transformer模型已被证明是更优秀的学习者。它们的架构允许使用额外的数据和计算能力进行扩展,并且可以通过集成额外的输入模式来进行增强。

  在过去的一年里,transformer模型已经成为机器人领域的一项重要资产,有几种型号机器人正在利用这一模型的多功能性来增强机器人的各种能力。transformer模型的好处包括改进编码和不同模式的混合,以及将高级自然语言指令翻译为机器人的具体规划步骤。

  研究人员总结道:“与视觉和语言等领域类似,我们相信transformer模型可能会促进我们未来在扩展现实世界人形运动的学习方法方面取得进展。”

延伸阅读:

Powered by Froala Editor