

一种基于强化学习的自适应轨道交通调度方法、系统、终端.pdf
一条****彩妍
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于强化学习的自适应轨道交通调度方法、系统、终端.pdf
本发明属于交通调度技术领域,公开了一种基于强化学习的自适应轨道交通调度方法、系统、终端,基于常发性客流量与偶发性客流量的环境建模方法建立适用于强化学习的轨道列车调度的马尔可夫决策模型;确定从环境中提取特征的轨道交通调度方案,进行轨道交通调度。本发明提供了一个基于强化学习的自适应轨道交通调度方法,可以根据乘客数目来调度轨道交通车辆,使得有关公司在保证乘客满意度的同时,保证收益最大化。本发明的基于深度强化学习方法的列车调度方案有着自适应客流量的优点,在保证载客率的同时,使得运营成本与顾客等待时间更低。
一种基于深度学习的自适应经济调度系统及方法.pdf
本发明公开了一种基于深度学习的自适应经济调度系统,其特征在于:它包括负荷矩阵构建模块、自适应学习模型及训练样本集构建模块、学习模型的训练目标构建模块、差异化训练样本集构建模块、长短期记忆网络构建模块和实时经济调度自适应学习模型构建模块;本发明基于完美调度理念生成学习模型训练目标,并利用系统中存储的海量历史数据对LSTM‑IIU网络对进行训练,一旦学习模型构建完成,将目标调度时刻的预测数据输入即可得到对应的实时经济调度方案。
一种基于深度强化学习的集群任务调度方法及系统.pdf
本发明提出一种基于深度强化学习的集群任务调度方法及系统,包括采用强化学习对异构计算资源平台中的任务进行实时调度,将计算平台中物理机组别信息、来自用户的任务需求信息以及任务执行成本作为强化学习的状态空间,将可用的物理机组集合作为强化学习的动作空间,通过深度Q网络方法,通过与异构计算平台环境信息的变化,学习适应动态变化的任务类型在异构资源物理机上的不同执行效率,资源利用效率即物理机执行任务时的资源使用占比;采用遗传算法,在前一步决策结果产生的物理机组中,根据不同物理机的资源使用情况,最大化资源利用效率,进行任
一种AFDX终端系统基于子虚链路的调度方法.pdf
本发明涉及一种AFDX终端系统基于子虚链路的调度方法,采用将不同长度等级的虚拟链路分成各个等级分级调度,每个等级内部再进行子虚拟链路轮询的方式选择需要发送的链路,使得不同队列能最大限度的平等地利用带宽资源,达到增大带宽利用率,减小平均发送延迟的目的。
一种基于深度强化学习的出租车调度方法及系统.pdf
本发明涉及一种基于深度强化学习的出租车调度方法及系统,所述系统包括:区域构建模块、需求预测模块、车辆调度模块、模拟器;所述方法包括:S1:形成区域网络;S2:预测任意区域在任意的时间中将会出现的订单数量;S3:计算出一个区域总的车辆供应;获取每个区域的需求/供应状态;S4:将任意空闲车辆所在区域和邻居区域的状态输入训练好的出租车调度模型中,得到该车辆的调度策略,确定该车是继续留在当地区域还是调度到系统指定的邻居区域中。本发明实现对空闲出租车进行调度,增加了订单匹配成功率,减少了乘客的等待时间,提高了出租车