预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113849903A(43)申请公布日2021.12.28(21)申请号202110999851.1G06F111/10(2020.01)(22)申请日2021.08.26(71)申请人清华大学地址100084北京市海淀区清华园1号(72)发明人李升波任彦刚关阳余冬杰成波陈建宇(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人廖元秋(51)Int.Cl.G06F30/15(2020.01)G06F30/20(2020.01)G06Q10/04(2012.01)G06Q50/30(2012.01)G06F111/04(2020.01)权利要求书3页说明书13页附图2页(54)发明名称智能汽车最优决控模型构建及求解方法、装置和存储介质(57)摘要本公开提供的智能汽车最优决控模型构建及求解方法、装置和存储介质,包括:构建智能汽车的最优决控模型,以最小化自车的路径跟踪性能和预测跟踪误差之和作为最优决控模型的目标函数,分别以自车动力学模型、自车与周围交通参与者的距离、自车与道路的距离和自车与信号灯的距离作为最优决控模型的运动约束和安全约束,以评价函数和策略函数作为最优决控模型的输出;建立学习型罚函数方法处理安全约束,在探索过程中监测不安全的驾驶状态并对违反约束的策略施加惩罚,使得策略朝着满足约束的方向迭代,最终输出最优决控模型的最优策略函数和最优评价函数。本公开具有高安全性和强智能性,突破了现有决控求解器独立优化且依赖人工规则的瓶颈。CN113849903ACN113849903A权利要求书1/3页1.一种智能汽车最优决控模型构建及求解方法,其特征在于,包括:构建智能汽车的最优决控模型,以最小化自车的路径跟踪性能和预测跟踪误差之和作为所述最优决控模型的目标函数,以自车动力学模型作为所述最优决控模型的运动约束,以自车与周围交通参与者的距离、自车与道路的距离和自车与信号灯的距离作为所述最优决控模型的安全约束,以用于从候选路径集中选择最优路径的评价函数和用于确定与所述最优路径对应的最优自车控制指令的策略函数作为所述最优决控模型的输出;其中,所述路径跟踪性能表征自车在未来预测时域内与候选路径的差异及自车在跟踪过程中的稳定性和能量消耗,所述预测跟踪误差用于评价对不同路径进行跟踪的优劣;建立学习型罚函数方法处理所述安全约束,在探索过程中监测不安全的驾驶状态并对违反约束的策略施加惩罚,使得策略朝着满足约束的方向迭代,最终输出所述最优决控模型的最优策略函数和最优评价函数。2.根据权利要求1所述的智能汽车最优决控模型构建及求解方法,其特征在于,所述智能汽车的最优决控模型的数学表达式如下:xself(τ+1)=Fself(xself(τ),uτ(θ))(2)xsurr(τ+1)=Fsurr(xsurr(τ),xself(τ),uτ(θ))(3)xroad(τ)=Froad(xself(τ))(4)gsurr(xself(τ),xsurr(τ))≥Dsurr(5)groad(xself(τ),xroad)≥Droad(6)glight(xself(τ),xlight(τ)=R)≥Dlight(7)其中:式(1)为所述最优决控模型的目标函数,Jtrack(θ)表示策略函数的性能指标,即所述路径跟踪性能,Jscore(w)表示评价函数的性能指标,即所述预测跟踪误差,θ和w分别代表待优化的策略函数参数和评价函数参数;t为初始时刻,τ是预测时域的虚拟时间,T是预测时域T长度;sτ表示τ时刻的驾驶状态,sτ=[xref(τ),xself(τ),xsurr(τ),xroad(τ),xligh(τ)],xref(τ)表示τ时刻的候选路径状态;xself(τ),xsurr(τ),xroa(τ)分别表示τ时刻的自车状态,周围交通参与者状态和道路状态;xlight(τ)表示τ时刻的信号灯状态;表示不同初始驾驶状态st分布下的期望性能,所述不同初始驾驶状态分布为不同候选路径、自车状态、周围交通参与者状态、道路状态以及信号灯状态的联合分布;uτ(θ)是自车控制指令,满足uτ(θ)=πθ(sτ),πθ(sτ)为从时刻τ的驾驶状态sτ到最优自车动作的映射;Vw(st)为从时刻t的驾驶状态st到最优路径跟踪性能的映射;l(·)表示每一步的跟踪代价;式(2)为自车的动力学模型,Fself(·)为自车动力学方程;2CN113849903A权利要求书2/3页式(3)为周围交通参与者的运动模型,Fsurr(·)用于计算下一时刻交通参与者如行人、自行车和机动车的运动状态;式(4)为与自车行驶相关的道路状态,Froad(·)用于计算自车当前状态对应的道路信息;式(5)为周围交通参与者的安全约束,g