在Facebook和加州大学伯克利分校的最新论文中,伯克利大学的研究人员提出了一种载有载荷的无人机飞行计划的方法,该方法“学习了如何学习”环境动力学模型。实验结果表明,这项工作可以为未来机器人的开发提供信息-可能在仓库或其他工业环境中-面对不可预测的情况,它们可以与世界进行物理互动并适应世界。

该团队使用元学习(机器学习的一个子领域),在其中将学习算法应用于有关机器学习实验的元数据,以训练模型以快速适应已暂停的有效负载控制任务中的动态变化。在此任务中,四轴飞行器必须自行定位才能沿着通向目标目的地的路径拾取目标物体。

最大的挑战之一来自引入的不同有效载荷的可变性,所有有效载荷都通过电缆和磁性夹具固定。例如,与连接较长电缆的负载相比,电缆较短的有效负载振荡得更快。

为了解决这个问题,该团队使用来自各种物理条件(例如不同的有效负载质量和系绳长度)的数据训练了动力学模型,并用代表未知环境和任务因素的变量对其进行了扩充。通过初始化动力学模型,获取当前状态,解决某个动作,执行该动作,记录结果,然后重新训练动力学模型,这使系统能够在测试时适应新的有效载荷。

研究人员通过让一个人沿着随机路径对每个不同的悬挂有效载荷驾驶四轴飞行器(DJI Tello)来收集初始训练数据。(有问题的有效载荷是重量在10到15克之间的3D打印盒。)每0.25秒记录一次数据,包括有效载荷的控制和位置,并使用外部安装的RGB摄像头进行跟踪,并保存到由单独的数据集-每个有效负载任务一个。

最终语料库包含1.1个飞行小时的约16,000个数据点,其中5%保留用于评估。

研究人员报告说,在实验过程中,四轴飞行器大部分时间都将有效载荷运送到了目的地。话虽如此,他们承认仍有改进的空间。必须手动指定悬挂有效载荷的起落时间,并且该方法仅假设了悬挂有效载荷的位置估计。他们留下了克服这些挑战的未来工作。

研究人员写道:“我们相信,这是在真实世界的四轴飞行器上首次展示的元学习方法,该方法仅使用真实世界的训练数据,与非自适应方法相比,该数据成功地显示了闭环性能的改进,”“尽管在这项工作中我们仅考虑四轴飞行器有效载荷运输的特定任务,但我们注意到我们的方法是通用的,适用于在不断变化的条件下与环境相互作用的任何机器人系统。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。