预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114217303A(43)申请公布日2022.03.22(21)申请号202111344268.3(22)申请日2021.11.12(71)申请人鹏城实验室地址518000广东省深圳市南山区兴科一街2号(72)发明人何哲朱华张巍李胜全张爱东梅涛陆海博叶心宇贾庆勇(74)专利代理机构深圳市世纪恒程知识产权代理事务所44287代理人吴士卿(51)Int.Cl.G01S13/66(2006.01)权利要求书2页说明书11页附图5页(54)发明名称目标定位跟踪方法及装置、水下机器人和存储介质(57)摘要本发明公开了一种目标定位跟踪方法及装置、水下机器人和存储介质,所述目标定位跟踪方法包括以下步骤:获取当前时刻非合作目标的多模态信息;根据所述多模态信息生成所述非合作目标在当前时刻对应的实际位置概率图;将所述实际位置概率图输入深度神经网络中,得到最优策略;将所述最优策略输入深度强化学习网络中,得到所述非合作目标的运动轨迹;控制所述机器人基于所述非合作目标的运动轨迹跟踪所述非合作目标,解决对非合作目标的定位跟踪精度低导致非合作目标跟踪丢失的问题,提高对非合作目标的跟踪精度。CN114217303ACN114217303A权利要求书1/2页1.一种目标定位跟踪方法,其特征在于,所述方法包括:获取当前时刻非合作目标的多模态信息;根据所述多模态信息生成所述非合作目标在当前时刻对应的实际位置概率图;将所述实际位置概率图输入深度神经网络中,得到最优策略;将所述最优策略输入深度强化学习网络中,得到所述非合作目标的运动轨迹;控制所述机器人基于所述非合作目标的运动轨迹跟踪所述非合作目标。2.如权利要求1所述的目标定位跟踪方法,其特征在于,所述根据所述多模态信息生成所述非合作目标在当前时刻对应的实际位置概率图的步骤,包括:对当前时刻获取的多模态信息进行栅格化以得到多个具有坐标信息的栅格;采用所述坐标信息计算所述非合作目标在各个栅格中的实际位置概率;根据所述实际位置概率生成所述非合作目标在当前时刻对应的实际位置概率图。3.如权利要求2所述的目标定位跟踪方法,其特征在于,所述采用所述坐标信息计算所述非合作目标在各个栅格中的实际位置概率的步骤,包括:采用实际位置概率公式计算非合作目标的实际位置概率,其中,所述实际位置概率计算公式为:其中,所述Zgrid为观测站追踪者与每个栅格的相对角度,Pgrid为栅格坐标,Ptrus为非合作目标的实际位置,Pauv为观测站追踪者的位置,为观测站追踪者与非合作目标的相对测量角度,σsonar为测量噪声。4.如权利要求1所述的目标定位跟踪方法,其特征在于,所述将所述实际位置概率图输入深度神经网络中,得到最优策略的步骤包括:将非合作目标在当前时刻对应的实际位置概率图与非合作目标在当前时刻的上一时刻对应的实际位置概率图进行卷积得到似然直方图;对所述似然直方图进行编码得到最优策略。5.如权利要求4所述的目标定位跟踪方法,其特征在于,所述将非合作目标在当前时刻对应的实际位置概率图与非合作目标在当前时刻的上一时刻对应的实际位置概率图进行卷积得到似然直方图的步骤,包括:采用似然值更新公式对当前时刻对应的实际位置概率图中每个栅格的似然值进行更新,所述似然值更新公式为:根据更新后的所述每个栅格的似然值生成似然直方图:其中,n表示非合作目标的数量。6.如权利要求4所述的目标定位跟踪方法,其特征在于,所述对所述似然直方图进行编码得到最优策略的步骤,包括:对所述似然直方图进行归一化处理;2CN114217303A权利要求书2/2页采用双线性插值法对归一化处理后的所述似然直方图的分辨率进行调整;对分辨率调整后的所述似然直方图进行编码,以得到最优策略。7.如权利要求1所述的目标定位跟踪方法,其特征在于,所述深度强化学习网络为双延迟深度确定性策略梯度。8.一种目标定位跟踪装置,其特征在于,所述装置包括:信息获取模块,用于获取当前时刻非合作目标的多模态信息,所述多模态信息包括所述非合作目标的方位信息和/或机器人与所述非合作目标的距离信息;生成模块,用于根据所述多模态信息生成所述非合作目标在当前时刻对应的实际位置概率图;第一输入模块,用于将所述实际位置概率图输入深度神经网络中,得到最优策略;第二输入模块,用于将所述最优策略输入深度强化学习网络中,得到所述非合作目标的运动轨迹;运动控制模块,用于控制所述机器人基于所述非合作目标的运动轨迹跟踪所述非合作目标。9.一种水下机器人,其特征在于,所述水下机器人包括存储器、处理器以及存储在所述存储器并可在所述处理器上运行的目标定位跟踪程序,所述目标定位跟踪程序被所述处理器执行时实现如权利要求1‑7任一项所述的目标定位跟踪方法的各个步骤。10.一种存