DOI：10.3969/j.issn.1000-386x.2021.12.044

基于强化学习的无线传能网络节点控制算法

引用

摘要：

以无线传能网络的节点控制问题为研究对象,针对统一化的节点模型设计一种基于策略梯度的强化学习算法.该算法使用神经网络作为控制器,并设计一套奖励机制用来评估控制结果的优劣,以最大化累计奖励为目标优化网络参数,使神经网络控制器达到更好的控制效果.仿真结果表明,只需设置对控制结果的奖励机制,就可以让节点根据供电需求的变化学习到对应的控制策略,适用于近似周期性的供电场景,也适用于极端情况的供电控制.

关键词：强化学习;策略梯度;机器学习;电网控制;无线传能

所属期刊栏目：38

分类号：TP3-05(计算技术、计算机技术)

资助基金：国防创新基金DUT17GF108

在线出版日期：2021-12-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：274-279

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

基于强化学习的无线传能网络节点控制算法