预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113705067A(43)申请公布日2021.11.26(21)申请号202111266955.8G06Q50/06(2012.01)(22)申请日2021.10.29G06N3/00(2006.01)G06N3/04(2006.01)(71)申请人中国电力科学研究院有限公司G06N3/08(2006.01)地址100192北京市海淀区清河小营东路G06F111/04(2020.01)15号G06F111/08(2020.01)(72)发明人王继业蒲天骄周翔陈盛王新迎(74)专利代理机构北京中巡通大知识产权代理有限公司11703代理人李晓晓(51)Int.Cl.G06F30/25(2020.01)G06F30/27(2020.01)G06Q10/04(2012.01)G06Q10/06(2012.01)权利要求书2页说明书8页附图4页(54)发明名称一种微网优化运行策略生成方法、系统、设备及存储介质(57)摘要本发明公开了一种微网优化运行策略生成方法、系统、设备及存储介质,包括:建立深度确定性策略梯度算法下的神经网络模型;以微网总运行成本最低以及新能源消纳程度最大为优化目标,基于分类经验回放机制,采用深度确定性策略梯度算法对神经网络模型进行优化;利用优化后的神经网络模型生成微网优化运行策略,该方法、系统、设备及存储介质计算的复杂程度较低,且不依赖新能源出力及负荷的精确建模。CN113705067ACN113705067A权利要求书1/2页1.一种微网优化运行策略生成方法,其特征在于,包括:针对微网,获取深度确定性策略梯度算法的状态空间S,所述深度确定性策略梯度算法的状态空间S包括风光发电出力、用户负荷量、分时段电价、锂电池荷电状态以及所处时段;将深度确定性策略梯度算法的状态空间S输入到优化后的神经网络模型,以生成微网优化运行策略,其中,在对神经网络模型进行优化的过程中,以微网总运行成本最低以及新能源消纳程度最大为优化目标,基于分类经验回放机制,采用深度确定性策略梯度算法对神经网络模型进行优化。2.根据权利要求1所述的微网优化运行策略生成方法,其特征在于,深度确定性策略梯度算法中的五元组为(S、A、L、r、γ),其中,S为状态空间,A为动作空间,L为状态转移概率,r为奖励函数,γ为折扣因子。3.根据权利要求2所述的微网优化运行策略生成方法,其特征在于,动作空间A包括微型燃气轮机出力及锂电池充放电功率。4.根据权利要求3所述的微网优化运行策略生成方法,其特征在于,在对神经网络模型进行优化的过程中,当没有弃风弃光以及状态动作越限的情况时,则对神经网络模型进行优化过程中的奖励函数为:其中,为t时间段微网的总运行成本,d为正数。5.根据权利要求4所述的微网优化运行策略生成方法,其特征在于,微网总运行成本为:其中,为微网中微型燃气轮机在t时段的发电成本,CWT(t)为风机在t时段的发电成本,CPV(t)为光伏在t时段的发电成本,CP(t)为t时段微网向外部电网的购售电成本,CS(t)为储能成本,T为总的调度时间段,Ng为微网中微型燃气轮机的台数。6.根据权利要求3所述的微网优化运行策略生成方法,其特征在于,在对神经网络模型进行优化的过程中,当存在弃风、弃光情况或者动作、状态不满足约束时,则对神经网络模型进行优化过程中的奖励函数为:其中,F1(t)为t时刻弃风/弃光惩罚,F2(t)及F3(t)为t时刻可控设备动作及状态越限惩罚。7.根据权利要求6所述的微网优化运行策略生成方法,其特征在于,弃风/弃光惩罚F1(t)为:2CN113705067A权利要求书2/2页其中,Cw为弃风成本系数,Cp为弃光成本系数,PWT_C(t)为弃风量,PPV_C(t)为弃光量。8.根据权利要求6所述的微网优化运行策略生成方法,其特征在于,可控设备动作及状态越限惩罚F2及F3分别为:maxmax其中,ω1,i、ω2,i、δ1,i及δ2,i为动作或状态的越限惩罚系数,ai,up及ai,down分别为爬minmax坡率的上下限,bi及bi分别为微型燃气轮机出力、联络线功率、储能充放电功率及储能状态约束的上下限。9.一种微网优化运行策略生成系统,其特征在于,包括:获取模块(4);用于针对微网,获取深度确定性策略梯度算法的状态空间S,所述深度确定性策略梯度算法的状态空间S包括风光发电出力、用户负荷量、分时段电价、锂电池荷电状态以及所处时段;生成模块(3),用于将深度确定性策略梯度算法的状态空间S输入到优化后的神经网络模型,以生成微网优化运行策略,其中,在对神经网络模型进行优化的过程中,以微网总运行成本最低以及新能源消纳程度最大为优化目标,基于分类经验回放机制,采用深度确定性策略梯度算法对神经网