期刊文章详细信息
文献类型:期刊文章
ZHANG Qinhao;AO Baiqiang;ZHANG Qinxue(Beijing Institute of Electronic Engineering, Beijing 100854, China;College of Computer Science, North China Institute of Aerospace Engineering, Langfang 065000, China)
机构地区:[1]北京电子工程总体研究所,北京100854 [2]北华航天工业学院计算机学院,河北廊坊065000
基 金:中国博士后科学基金(2017M620863)资助课题
年 份:2020
卷 号:42
期 号:2
起止页码:414-419
语 种:中文
收录情况:BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD2019_2020、EI、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:在未来的战场中,智能导弹将成为精确有效的打击武器,导弹智能化已成为一种主要的发展趋势。本文以传统的比例制导律为基础,提出基于强化学习的变比例系数制导算法。该算法以视线转率作为状态,依据脱靶量设计奖励函数,并设计离散化的行为空间,为导弹选择正确的制导指令。实验仿真验证了所提算法比传统的比例制导律拥有更好的制导精度,并使导弹拥有了自主决策能力。
关 键 词:比例制导 制导律 脱靶量 机动目标 强化学习 Q学习 时序差分算法
分 类 号:V448.133]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...