预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114200936A(43)申请公布日2022.03.18(21)申请号202111482549.5(22)申请日2021.12.06(71)申请人广东工业大学地址510090广东省广州市越秀区东风东路729号(72)发明人吴宗泽赖家伦李嘉俊任志刚曾德宇(74)专利代理机构广州粤高专利商标代理有限公司44102代理人禹小明(51)Int.Cl.G05D1/02(2020.01)权利要求书3页说明书9页附图2页(54)发明名称基于最优控制及宽度学习的AGV实时路径规划方法(57)摘要本发明提出一种基于最优控制及宽度学习的AGV实时路径规划方法,涉及AGV路径规划的技术领域,首先构建AGV动力学模型,以AGV动力学模型作为动态约束,以时间‑燃耗最优为目标函数,建立最优控制模型并离线正向求解,生成若干不同起始点的最优控制轨迹,在此情况下,考虑离线优化较难实现实时最优控制以达到最优轨迹的目的,为了避免离线优化求解导致的滞后性,引入宽度学习网络,以不同的目标点作为分类依据,将最优控制轨迹整合归类成不同导航任务的训练数据集,增量式训练宽度学习网络,得到最终用于AGV实时路径规划的宽度学习网络,实现一定范围内任意起始点AGV路径规划的实时最优控制。CN114200936ACN114200936A权利要求书1/3页1.一种基于最优控制及宽度学习的AGV实时路径规划方法,其特征在于,所述方法包括以下步骤:S1.构建AGV动力学模型;S2.以AGV动力学模型作为动态约束,以时间‑燃耗最优为目标函数,建立最优控制模型;S3.随机生成AGV初始点,以初始点作为最优控制模型求解的初始条件,离线正向求解最优控制模型,生成若干不同起始点的最优控制轨迹,最优控制轨迹中包括“最优状态‑控制率”对;S4.构建宽度学习网络,基于“最优状态‑控制率”对,按目标位置将最优控制轨迹整合归类为不同的训练数据集,对宽度学习网络进行增量式离线训练;S5.离线训练完成后,确定宽度学习网络的权重参数,将训练完成的宽度学习网络作为实时控制器,用于AGV的路径实时规划。2.根据权利要求1所述的基于最优控制及宽度学习的AGV实时路径规划方法,其特征在于,步骤S1所述的AGV动力学模型为:其中,t为时间变量,t∈[0,tf],tf指定为末端状态所对应的时刻,x(t)、y(t)表示t时刻AGV中点所处的位置坐标的横坐标与纵坐标,以P=(x,y)表示AGV的中心所处的位置坐标;θ(t)表示t时刻的AGV与目标位置间的方位角,φ(t)表示t时刻的转向角,α(t)表示t时刻的方位角方向的加速度;ω(t)表示角速度,Lw表示AGV的轮距长度。3.根据权利要求2所述的基于最优控制及宽度学习的AGV实时路径规划方法,其特征在于,步骤S2所述以AGV动力学模型作为动态约束,以时间‑燃耗最优为目标函数,建立的最优控制模型表达式为:目标函数:约束条件:其中,J1表示燃耗;表示权衡优化目标中时间最优和燃耗最优的重视程度;ei表示根据已知的障碍物位置设计的路径约束,满足:其中,i=1,…,N,表示t时刻下第i个障碍物位置坐标,ri表示所对应的2CN114200936A权利要求书2/3页障碍物半径,k表示一个碰撞预警阈值;表示转化的路径约束,ε为趋近于0的一个正数;表示AGV动力学模型,s(t)=[x(t),y(t),v(t),φ(t),θ(t)]为状态变量,c=[α(t),ω(t)]为控制率,Bound(s(t),u(t))表示AGV的边界值约束;s(t0)和s(tf)表示给定的AGV初始状态和末状态。4.根据权利要求3所述的基于最优控制及宽度学习的AGV实时路径规划方法,其特征在于,步骤S3所述随机生成的AGV初始点表示为:s(t0)=[x_random,y_random,0,0,0]以初始点作为最优控制模型求解的初始条件,离线正向求解最优控制模型,方法不限定于最优控制直接法中的伪谱法和打靶法;首先对状态变量S(τ)和控制率C(τ)进行插值,用于求解计算,其中,插值方法不限定于拉格朗日插值法,最终生成若干不同起始点的最优控制轨迹,表示为:其中,表示最优控制轨迹集合,每一个(st,ct)组成“最优状态‑控制率”对(s,c)。5.根据权利要求4所述的基于最优控制及宽度学习的AGV实时路径规划方法,其特征在于,根据不同的目标位置整合,基于每个目标位置对应的“最优状态‑控制率”对(s,c),将最优控制轨迹整合归类为不同的训练数据集,对应表征为:其中,表示包含以A位置为目标状态下,所有最优控制轨迹得到的“最优状态‑控制率”对汇总的独立数据集,均同理。6.根据权利要求5所述的基于最优控制及宽度学习的AGV实时路径规划方法,其特征在于,构建的宽度