预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共31页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113625718A(43)申请公布日2021.11.09(21)申请号202110927868.6(22)申请日2021.08.12(71)申请人上汽大众汽车有限公司地址201805上海市嘉定区安亭镇于田路123号(72)发明人莫建林赖哲渊张汉驰(74)专利代理机构上海专利商标事务所有限公司31100代理人朱方杰骆希聪(51)Int.Cl.G05D1/02(2020.01)权利要求书6页说明书16页附图8页(54)发明名称车辆的行驶路径规划方法(57)摘要本发明提供一种车辆的行驶路径规划方法,包括以下步骤:基于地图数据和目标跟踪结果生成自车的环境状态特征图序列;获取所述自车的车辆状态信息;将所述自车的环境状态特征图序列和所述自车状态信息作为环境与状态数据,输入路径规划模型;获取所述路径规划模型输出的对所述自车的规划轨迹。本发明能够实现路径规划模型的强化学习和训练,使得其在车辆自动驾驶的场景中得到更好的应用。CN113625718ACN113625718A权利要求书1/6页1.一种车辆的行驶路径规划方法,包括以下步骤:基于地图数据和目标跟踪结果生成自车的环境状态特征图序列;获取所述自车的车辆状态信息;将所述自车的环境状态特征图序列和所述自车状态信息作为环境与状态数据,输入路径规划模型;获取所述路径规划模型输出的对所述自车的规划轨迹。2.根据权利要求1所述的车辆的行驶路径规划方法,其特征在于,所述方法还包括:获取所述路径规划模型输出的模型回报估计值,并基于所述回报估计值对所述模型进行评估。3.根据权利要求1所述的车辆的行驶路径规划方法,其特征在于,所述路径规划模型包括依次连接的主干神经网络、特征向量化第一模块、第一全连接网络、第二全连接网络、特征向量化第二模块、第三全连接网络和第四全连接网络;其中,所述车辆的环境状态特征图序列输入至所述主干神经网络,所述车辆状态信息输入至所述特征向量化第一模块。4.根据权利要求3所述的车辆的行驶路径规划方法,其特征在于,所述环境与状态数据通过控制器模块和环境与状态数据计算模块的运行实现更新;其中,所述第二全连接网络将所述自车的规划轨迹数据输入所述控制器模块,所述控制器模块控制所述自车行驶,并将所述自车行驶产生的第一数据和观测所述自车的周围产生的第二数据输入所述环境与状态数据计算模块,所述环境与状态数据计算模块基于所述第一数据和第二数据,更新所述环境与状态数据;所述第四全连接网络输出模型回报估计值。5.根据权利要求4所述的车辆的行驶路径规划方法,其特征在于,所述环境与状态数据计算模块输出所述路径规划模型的车辆状态转移奖励值。6.根据权利要求1所述的车辆的行驶路径规划方法,其特征在于,所述车辆状态信息包括速度,加速度,航向角以及航向角角速度。7.根据权利要求2所述的车辆的行驶路径规划方法,其特征在于,获取所述路径规划模型输出的模型回报估计值包括:计算所述路径规划模型的车辆速度奖励值;计算所述路径规划模型的车辆位置奖励值;基于所述车辆速度奖励值和所述车辆位置奖励值得到车辆状态转移奖励值;基于所述车辆状态转移奖励值,计算得到所述模型回报估计值。8.根据权利要求7所述的车辆的行驶路径规划方法,其特征在于,计算所述路径规划模型的车辆速度奖励值包括:根据自车实际速度Vreal和自车期望速度Vexp得到奖励参数Gspeed;根据所述奖励参数Gspeed得到所述车辆速度奖励值rt,speed。9.根据权利要求8所述的车辆的行驶路径规划方法,其特征在于,根据自车实际速度Vreal和自车期望速度Vexp得到奖励参数Gspeed包括:2CN113625718A权利要求书2/6页其中,|Vreal‑Vexp|表示对Vreal‑Vexp取绝对值。10.根据权利要求8所述的车辆的行驶路径规划方法,其特征在于,根据所述奖励参数Gspeed得到所述车辆速度奖励值rt,speed包括:当Gspeed>1或Gspeed=1,rt,speed=0;当Gspeed=0,rt,speed=1;当0<Gspeed<1,11.根据权利要求8所述的车辆的行驶路径规划方法,其特征在于,所述自车期望速度Vexp的计算包括:当自车遇到红灯路况时,当所述自车与红灯停止线的距离大于L1时,所述自车期望速度Vexp=Vexp,max;当所述自车与所述红灯停止线的距离小于等于L1时,所述自车期望速度按照进行线性减速;其中,LD为所述自车在当前时刻与所述红灯停止线的距离,所述红灯停止线距离红灯的距离为L2,Vexp,max为最大期望速度。12.根据权利要求8所述的车辆的行驶路径规划方法,其特征在于,所述自车期望速度Vexp的计算包括:当自车遇到障碍物路况时,当所述自车与所述障碍物的实