期刊文章详细信息
文献类型:期刊文章
QI Rong;WU Xian-feng
机构地区:[1]包头广播电视大学,包头014010 [2]包头铁道职业技术学院,包头014010
基 金:内蒙古广播电视大学2021年度教育教学研究重大课题攻关项目(EZDGG202104);内蒙古广播电视大学2021年度科学研究一般课题(IMOU-EZDGGZ2125)。
年 份:2022
卷 号:44
期 号:12
起止页码:177-180
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、JST、ZGKJHX、核心刊
摘 要:针对传统强化学习中Q学习算法在机器人路径规划过程中易引发维数灾难及搜索效率低的问题,提出一种深度强化学习算法。在Q学习算法中引入深度学习,通过深度学习网络对参数进行不断的训练和优化,利用网络输出值来替代传统的Q值表,从而避免陷入维度灾难。另外针对算法的过估计问题,设计了一种深度双Q学习策略,其中包含了两个网络结构对机器人的执行动作和决策评估进行分别计算。同时采用重回放机制,改善算法收敛性。最后,利用贝塞尔曲线对路径进行平滑。仿真表明,深度强化学习算法相较于Q学习算法,路径各项指标得以提升,对机器人工作运行更为有利。
关 键 词:Q学习 深度强化学习 机器人 路径规划
分 类 号:TP242]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...

