预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116011123A(43)申请公布日2023.04.25(21)申请号202310154088.1(22)申请日2023.02.23(71)申请人清华大学地址100084北京市海淀区清华园1号(72)发明人李升波占国建蒋宇轩兰志前吕尧任彦刚王建强成波李克强(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201专利代理师王萌(51)Int.Cl.G06F30/15(2020.01)G06F30/20(2020.01)G06F119/02(2020.01)权利要求书3页说明书9页附图2页(54)发明名称一种智能汽车连续时间最优决控模型构建及求解方法(57)摘要本公开提供的智能汽车连续时间最优决控模型构建及求解方法,包括:构建智能汽车连续时间最优决控模型,以自车的终端状态性能函数和从初始时刻至终端时刻的有限时域内的效用函数的连续时间积分作为目标函数,效用函数用于表达自车的综合性能,以智能汽车的连续时间动力学方程作为最优决控模型的运动约束,以参数化最优策略作为最优决控模型的输出;对最优决控模型进行迭代求解,每次迭代中,首先从初始时刻至终端时刻前向求解终端时刻的自车状态,然后从终端时刻至初始时刻后向求解策略梯度,并以梯度下降的方式更新参数化策略的参数,不断重复上述迭代过程直至参数化策略的参数收敛,得到最优参数化策略。本公开精度高、适用范围广、节省内存。CN116011123ACN116011123A权利要求书1/3页1.一种智能汽车连续时间最优决控模型构建及求解方法,其特征在于,包括:构建智能汽车连续时间最优决控模型,以自车的终端状态性能函数和从初始时刻至终端时刻的有限时域内的效用函数的连续时间积分作为目标函数,所述效用函数用于表达自车的综合性能,所述自车的综合性能包括自车的路径跟踪性能、舒适性能和能量消耗性能,以智能汽车的连续时间动力学方程作为所述智能汽车连续时间最优决控模型的运动约束,以参数化最优策略作为所述智能汽车连续时间最优决控模型的输出;对所述智能汽车连续时间最优决控模型进行迭代求解,每次迭代过程中,首先从初始时刻至终端时刻前向求解终端时刻的自车状态,然后从终端时刻至初始时刻后向求解策略梯度,并以梯度下降的方式更新参数化策略的参数,不断重复上述迭代过程直至参数化策略的参数收敛,迭代求解结束,得到最优参数化策略。2.根据权利要求1所述的智能汽车连续时间最优决控模型构建及求解方法,其特征在于,构建的所述智能汽车连续时间最优决控模型的表达式如下:式(1)中,J(x0;θ)为智能汽车连续时间最优决控模型的目标函数,定义为终端状态性能函数φ(xT)与从初始时刻0至终端时刻T的有限时域[0,T]内效用函数l(xt,ut)的连续时间积分之和,xt和ut分别为有限时域[0,T]内任意时刻t的自车状态和自车动作,将初始时刻和终端时刻的自车状态分别定义为初始状态和终端状态;πθ(xt,t;θ)为参数化策略,用于根据有限时域[0,T]内的t时刻及该时刻的自车状态xt得到t时刻的自车动作ut,θ为参数化策略中待优化的参数;设从初始时刻0至时刻t时域[0,t]内的任意时刻为τ,将时域[0,t]内效用函数l(xτ,uτ)的连续时间积分定义为效用状态ct,以此将目标函数J(x0;θ)转化为只与自车的终端状态xT和终端时刻的效用状态cT有关的函数,记为Φ(xT,cT);式(2)为构建的智能汽车连续时间最优决控模型的约束,即时刻t的自车状态xt需要满足智能汽车的连续时间动力学方程的运动约束。3.根据权利要求2所述的智能汽车连续时间最优决控模型构建及求解方法,其特征在于,针对结构化道路场景的轨迹跟踪问题,设有限时域[0,T]内t时刻的自车状态xt包含时刻智能汽车在大地坐标系下的横纵向位置pxt,pyt、横纵向速度vxt,vyt、横摆角和横摆角速度ωt,设有限时域[0,T]内t时刻的自车动作ut包含t时刻智能汽车的加速度at和前轮转角2δt;设定目标状态为xtarget,令终端状态性能函数φ(xT)为:φ(xT)=(xT‑xtarget);设效用函TT数l(xt,ut)为:l(xt,ut)=e(xt)Qe(xt)+utRut,其中Q,R分别为状态效用矩阵和动作效用矩阵,均采用对角正定矩阵,e(xt)为状态跟踪误差。4.根据权利要求3所述的智能汽车连续时间最优决控模型构建及求解方法,其特征在于,所述状态跟踪误差2CN116011123A权利要求书2/3页分别为自车状态xt中各参数的参考值。5.根据权利要求2所述的智能汽车连续时间最优决控模型构建及求解方法,其特征在于,所述对智能汽车连续时间最优决控模型进行迭代求解,具体包括以下步骤:2‑1)参数初始化设自车的初始状态分布为d并对其进行初