预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115951701A(43)申请公布日2023.04.11(21)申请号202211591501.2(22)申请日2022.12.12(71)申请人华南理工大学地址510641广东省广州市天河区五山路381号(72)发明人张平朱志(74)专利代理机构广州嘉权专利商标事务所有限公司44205专利代理师郑宏谋(51)Int.Cl.G05D1/10(2006.01)权利要求书2页说明书9页附图3页(54)发明名称一种多无人机局部动态避障方法、装置和存储介质(57)摘要本发明公开了一种多无人机局部动态避障方法、装置和存储介质,其中方法包括:基于马尔科夫决策过程对分布式的多无人机动态避障问题进行形式化建模;通过搭载在各架无人机上的激光雷达获取点云数据,对点云数据进行处理,获得障碍物信息;构建深度神经网络,以完成观测输入到动作输出的映射以及网络更新的方法;其中观测输入为获得的障碍物信息;基于ORCA算法对深度神经网络进行训练,将训练后的模型用于多无人机局部动态避障。本发明采用基于几何学方法与深度强化学习方法相结合的动态避障算法作为多无人机系统的避障方法,有效解决多无人机局部路径规划与避障问题。本发明可广泛应用于多无人机局部动态避障与路径规划领域。CN115951701ACN115951701A权利要求书1/2页1.一种多无人机局部动态避障方法,其特征在于,包括以下步骤:基于马尔科夫决策过程对分布式的多无人机动态避障问题进行形式化建模;通过搭载在各架无人机上的激光雷达获取点云数据,对点云数据进行处理,获得障碍物信息;构建深度神经网络,以完成观测输入到动作输出的映射;其中观测输入为获得的障碍物信息;基于ORCA算法对深度神经网络进行训练,将训练后的模型用于多无人机局部动态避障。2.根据权利要求1所述的一种多无人机局部动态避障方法,其特征在于,所述基于马尔科夫决策过程对分布式的多无人机动态避障问题进行形式化建模,包括:将分布式的无人机通过检测障碍物,以完成避障并最终到达目标点的问题,建模为一个马尔科夫决策过程;所述马尔科夫决策过程采用六元组表示,即其中指的是状态空间,指的是动作空间,指的是状态转移模型,指的是回报函数,Ω指的是观测空间,是多无人机系统状态的观测概率分布。3.根据权利要求2所述的一种多无人机局部动态避障方法,其特征在于,对于多无人机系统中的每架无人机来说,T时刻的无人机观测空间定义为ot,其中含有以下部分:第i架无人机自身的位置第i架无人机的目标点位置tari,处理所得的观测到的环境信息无人机的动作空间就是可选速度空间中所选择的速度,其中可选速度空间为连续空间,即动作设计为4.根据权利要求2所述的一种多无人机局部动态避障方法,其特征在于,所述多无人机系统的任务包括以下几个部分:多无人机尽可能快地到达目标点;在到达目标点的过程中保证航行安全,即无人机之间或与障碍物之间不发生碰撞;回报函数设计如下:其中,为奖励包括避障奖励,为目标奖励,为时间奖励,具体表示为:避障奖励由无人机与障碍物之间的距离决定,在预设范围内,无人机越靠近障碍物则负奖励越大,远离则奖励越小,发生碰撞则给予固定负奖励并结束本回合;目标奖励无人机接近目标点时给予正奖励,到达目标点时基于固定奖励并结束回合,相反,当无人机远离目标点时,会根据无人机与目标点之间的距离按照比例给予一定的负奖励;时间奖励无人机到达目标点的时间越短所给的惩罚越小。5.根据权利要求1所述的一种多无人机局部动态避障方法,其特征在于,所述障碍物信息信息包括障碍物静态信息和障碍物动态信息;通过搭载在各架无人机上的激光雷达获取点云数据,对点云数据进行处理,获得障碍物信息,包括:2CN115951701A权利要求书2/2页对获得的点云数据进行聚类处理,以在点云数据中得到属于同一障碍物的反射点;获得聚类结果后,根据每个聚类中各点坐标获取聚类的中心点和聚类半径,作为障碍物的位置和尺寸;根据单帧点云数据获取障碍物静态信息,结合多帧点云数据获取障碍物动态信息。6.根据权利要求5所述的一种多无人机局部动态避障方法,其特征在于,所述对获得的点云数据进行聚类处理,包括:采用欧式聚类算法对点云数据进行聚类处理;其中,聚类依据是各点在空间中的欧氏距离是否小于预设阈值;该预设阈值通过以下方式确定:式中,Xi,Yi表示第i个点的坐标,Xlidar,Ylidar表示激光雷达坐标,α、β为系数;所述结合多帧点云数据获取障碍物动态信息,包括:计算多帧点云数据获之间的关联度,根据关联度进行数据关联,获得位置与速度的变化值作为测量值,将测量值输入扩展卡尔曼滤波算法,得到障碍物动态信息;其中关联度的计算方式为:式中,ΔL、ΔD、ΔI分别表示两帧间两个聚类之间的位置差值、大小差值和