预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113821035A(43)申请公布日2021.12.21(21)申请号202111108184.X(22)申请日2021.09.22(71)申请人北京邮电大学地址100876北京市海淀区西土城路10号(72)发明人乔媛媛曹晓静宁苒君杨洁(74)专利代理机构北京金咨知识产权代理有限公司11612代理人秦景芳(51)Int.Cl.G05D1/02(2020.01)权利要求书2页说明书17页附图8页(54)发明名称无人船轨迹追踪控制方法和装置(57)摘要本申请提供了一种无人船轨迹追踪控制方法和装置,其中,该方法包括:建立无人船运动模型,并通过构建的仿真环境模拟无人船和环境的交互过程;在对无人船运动模型的仿真交互的过程中产生训练数据,通过所述训练数据对所述无人船运动模型进行训练得到无人船控制器;将训练后的无人船控制器部署至目标无人船中,在所述目标无人船实际运行的过程中,对所述无人船控制器中的算法神经网络进行修正。通过上述方案解决了现有的无人船模型所存在的适应性和通用性较差的问题,达到了有效提升适应性和通用性的技术效果。CN113821035ACN113821035A权利要求书1/2页1.一种无人船轨迹追踪控制方法,其特征在于,所述方法包括:建立无人船运动模型,并通过构建的仿真环境模拟无人船和环境的交互过程;在对无人船运动模型的仿真交互的过程中产生训练数据,通过所述训练数据对所述无人船运动模型进行训练得到无人船控制器;将训练后的无人船控制器部署至目标无人船中,在所述目标无人船实际运行的过程中,对所述无人船控制器中的算法神经网络进行修正。2.根据权利要求1所述的方法,其特征在于,建立无人船运动模型包括:通过可微非线性方程建立如下的无人船运动模型:η=T(η)v‑1‑1v=M(τ+τenv)‑M(C(v)+D(v))v其中,x、y表示在地球坐标系下的无人船位置,ψ∈[‑π,π]表示无人船的航向角,是在船体坐标系下的无人船速度,u表示纵荡速度,v表示横荡速度,ω表示艏摇速度,T(η)表示地球坐标系和船体坐标系之间的转换矩阵,M(v)表示正定对称附加质量和惯性矩阵,D(v)表示阻尼矩阵,表示向心力与科里奥利矩阵,表示在3自由度无人船上的力和力矩,τenv表示环境干扰产生的力矩。3.根据权利要求1所述的方法,其特征在于,在对无人船运动模型的仿真交互的过程中产生训练数据,通过所述训练数据对所述无人船运动模型进行训练得到无人船控制器包括:在对无人船运动模型的仿真交互的过程中产生训练数据;建立奖励函数来评价训练数据的控制行为;通过所述训练数据,以最大化累计奖励值对所述无人船控制器进行训练网络迭代更新,直至拟合得到最优控制策略。4.根据权利要求3所述的方法,其特征在于,所述奖励函数包括以下奖励项:最小化追踪位置误差项、最小化航角误差项、角速度误差限制项、控制量震荡抑制项、能耗抑制项。5.根据权利要求3所述的方法,其特征在于,通过所述训练数据,以最大化累计奖励值对所述无人船控制器进行训练网络迭代更新,直至拟合得到最优控制策略,包括:以预设时间步长作为迭代更新的循环周期;按照所述循环周期,通过所述训练数据所述无人船控制器进行训练网络迭代更新;在迭代更新的过程中,计算每个循环周期之前预定时间内各周期的平均奖励值,确定当前循环周期是否奖励值已收敛,在确定已收敛的情况下,将当前循环周期得到的运动模型作为最优控制策略。6.根据权利要求1所述的方法,其特征在于,构建的仿真环境包括:通过建模和参数发现,构建无人船模型;选择轨迹曲线,通过对选定的轨迹曲线进行方程迭代,以生成目标起点随机方向上的目标轨迹,并在每个预设时间步长上给出目标轨迹上待追踪目标点的位置、航角、速度的状态信息;2CN113821035A权利要求书2/2页通过数学模型仿真,生成风浪特性;将构建的无人船模型、生成的目标轨迹和风浪特性,作为构建的仿真环境。7.一种无人船轨迹追踪控制装置,其特征在于,包括:建立模块,用于建立无人船运动模型,并通过构建的仿真环境模拟无人船和环境的交互过程;训练模块,用于在对无人船运动模型的仿真交互的过程中产生训练数据,通过所述训练数据对所述无人船运动模型进行训练得到无人船控制器;修正模块,用于将训练后的无人船控制器部署至目标无人船中,在所述目标无人船实际运行的过程中,对所述无人船控制器中的算法神经网络进行修正。8.根据权利要求7所述的装置,其特征在于,所述训练模块包括:生成单元,用于在对无人船运动模型的仿真交互的过程中产生训练数据;建立单元,用于建立奖励函数来评价训练数据的控制行为;训练单元,用于通过所述训练数据,以最大化累计奖励值对所述无人船控制器进行训练网络迭代更新,直至拟合得到最优控制策略。9.