10.12305/j.issn.1001-506X.2022.08.13
基于马尔可夫的多功能雷达认知干扰决策建模研究
多功能雷达是现代电磁战场上不可或缺的重要装备,针对多功能雷达的干扰一直是一个难题.本文在研究多功能雷达信号特点和雷达对抗过程的基础上,提出了雷达状态联合表征的方法,将多功能雷达的干扰决策问题建模为一个带收益的马尔可夫决策过程,设计了认知干扰决策系统,并通过基于Q-Learning的认知干扰决策算法求解该模型下的最佳干扰策略.通过仿真实验,证明了基于Q-Learning的认知干扰决策算法能够在缺乏先验经验的情况下学习到最佳干扰策略,具备"认知"的特性,并且在不稳定的环境中也具有较强的适应性,有效支撑了本文所提的干扰决策模型.
雷达对抗、马尔可夫决策过程、雷达状态、强化学习、Q-Learning
44
TN974
国家重点实验室基金CEMEE;CEMEE2020Z0203B
2022-10-11(万方平台首次上网日期,不代表论文的发表时间)
共10页
2488-2497