会议论文详细信息
文献类型:会议
作者单位:华北科技学院理学院力学教研室,廊坊,065201
会议文献:第17届北方七省市区力学学会学术会议论文集
会议名称:第17届北方七省市区力学学会学术会议
会议日期:20180811
会议地点:河南焦作
主办单位:北方七省市区力学学会学术工作委员会
出版日期:20180811
语 种:中文
摘 要:本文基于在线积分强化学习算法为带有部分未知参数的X-Y table高速定位机械设计出在线次优输出反馈控制器.X-Y table 是一种高速定位机械,是现代数控机床和电子制造装备中的关键部件,决定了数控机床和电子制造装备的精度和生产效率.强化学习又叫再励学习,它从环境中获得评价,通过试错来寻找最优策略,以其获得最高累积奖励.RL技术是一种只知道系统动力学的部分信息,就可以求解时间连续系统最优控制问题的在线算法.文章将基于IRL的求解次优输出反馈控制律的在线算法应用到X-Ytable高速定位系统中,首先给出了X-Y table控制系统方程;其次针对线性系统,分别给出了次优输出反馈控制的离线算法和在线算法,其中在线算法不需要知道线性系统的系统矩阵,它通过积分强化学习求解Bellman方程来替代Lyapunov方程的求解.最后分别利用离线算法和在线算法对X-Y table控制系统进行了控制仿真.仿真结果证明,该算法得出的结果与离线算法得出的结果非常的相近.而算法2 不需要知道系统的矩阵A.由于现实中,大部分的系统模型都是部分参数可知的,故该方法具有极为重要的现实意义.
关 键 词:X-Y table 线性连续系统 强化学习 次优输出反馈控制
分 类 号:TP1] TP2]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...