

一种基于知识辅助深度强化学习的多能系统经济调度方法.pdf
Ch****91
亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于知识辅助深度强化学习的多能系统经济调度方法.pdf
本发明公开了一种基于知识辅助深度强化学习的多能系统经济调度方法,本方法的具体步骤如下:首先,深度确定性策略梯度算法构建了一个智能体用于接收环境传递来的状态信息并探索对应的最优机组出力,该算法可以获得最优调度策略并且减轻维数灾难。其次,知识辅助强化学习算法作为保护器处于智能体与环境的中间层,保护器可以加快深度确定性策略梯度算法的收敛速度,同时保证智能体在探索试错过程中不会危害系统设备的安全。最后,在难以建立系统精确模型的情况下,基于知识辅助深度强化学习的多能系统经济调度方法可以有效地获得系统调度的最优经济性
基于双层强化学习方法的多能园区实时经济调度.docx
基于双层强化学习方法的多能园区实时经济调度基于双层强化学习方法的多能园区实时经济调度摘要:随着能源需求的不断增长和可再生能源的不断发展,多能源园区的经济调度问题成为一个研究热点。本文提出了一种基于双层强化学习方法的多能园区实时经济调度算法。该算法通过建立一个双层优化模型,实现了园区内各能源设备的协同运行和经济调度。通过仿真实验,验证了该算法在提高园区经济效益和降低能源消耗方面的有效性。关键词:多能园区,实时经济调度,双层强化学习,协同运行1.引言多能源园区是指通过集成多种能源形式和能源设备,实现能源互补和
一种基于深度强化学习的集群任务调度方法及系统.pdf
本发明提出一种基于深度强化学习的集群任务调度方法及系统,包括采用强化学习对异构计算资源平台中的任务进行实时调度,将计算平台中物理机组别信息、来自用户的任务需求信息以及任务执行成本作为强化学习的状态空间,将可用的物理机组集合作为强化学习的动作空间,通过深度Q网络方法,通过与异构计算平台环境信息的变化,学习适应动态变化的任务类型在异构资源物理机上的不同执行效率,资源利用效率即物理机执行任务时的资源使用占比;采用遗传算法,在前一步决策结果产生的物理机组中,根据不同物理机的资源使用情况,最大化资源利用效率,进行任
一种基于深度学习的自适应经济调度系统及方法.pdf
本发明公开了一种基于深度学习的自适应经济调度系统,其特征在于:它包括负荷矩阵构建模块、自适应学习模型及训练样本集构建模块、学习模型的训练目标构建模块、差异化训练样本集构建模块、长短期记忆网络构建模块和实时经济调度自适应学习模型构建模块;本发明基于完美调度理念生成学习模型训练目标,并利用系统中存储的海量历史数据对LSTM‑IIU网络对进行训练,一旦学习模型构建完成,将目标调度时刻的预测数据输入即可得到对应的实时经济调度方案。
一种基于深度强化学习的出租车调度方法及系统.pdf
本发明涉及一种基于深度强化学习的出租车调度方法及系统,所述系统包括:区域构建模块、需求预测模块、车辆调度模块、模拟器;所述方法包括:S1:形成区域网络;S2:预测任意区域在任意的时间中将会出现的订单数量;S3:计算出一个区域总的车辆供应;获取每个区域的需求/供应状态;S4:将任意空闲车辆所在区域和邻居区域的状态输入训练好的出租车调度模型中,得到该车辆的调度策略,确定该车是继续留在当地区域还是调度到系统指定的邻居区域中。本发明实现对空闲出租车进行调度,增加了订单匹配成功率,减少了乘客的等待时间,提高了出租车