10.3772/j.issn.1002-0470.2023.01.008
考虑源荷不确定性下微电网能量调度的深度强化学习策略
针对微电网中源荷不确定性问题,本文提出一种基于连续型深度确定性策略梯度(DDPG)算法的微电网能量调度方法.首先,以日运行成本最低为目标构建优化调度模型,并将该调度模型转化成马尔可夫决策过程(MDP),定义了马尔可夫决策模型的状态空间、动作空间和奖励函数.其次,利用长短期记忆(LSTM)神经网络提取环境中时序数据的未来趋势作为状态,从而在连续调度动作空间下改善深度强化学习算法收敛效果.最后,通过训练深度强化学习模型,对比多种算法下最优能量调度策略,验证了本文所提方法的有效性.
微电网、能量管理、强化学习、深度确定性策略梯度(DDPG)
33
G633.41;H319.3;TP301.6
浙江省自然科学基金资助项目LQ22E070007
2023-04-26(万方平台首次上网日期,不代表论文的发表时间)
共9页
79-87