期刊文章详细信息
文献类型:期刊文章
LIU Zhi-min;YE Bao-Lin;ZHU Yao-dong;YAO Qing;WU Wei-min(School of Information Science and Technology,Zhejiang Sci-Tech University,Hangzhou 310018,China;College of Information Science and Engineering,Jiaxing University,Jiaxing 314001,China;State Key Laboratory of Industrial Control Technology,Institute of Cyber-Systems and Control,Zhejiang University,Hangzhou 310027,China)
机构地区:[1]浙江理工大学信息学院,浙江杭州310018 [2]嘉兴学院信息科学与工程学院,浙江嘉兴314001 [3]浙江大学工业控制技术国家重点实验室,智能系统与控制研究所,浙江杭州310027
基 金:国家自然科学基金资助项目(61603154);浙江省自然科学基金资助项目(LY19F030014);工业控制技术国家重点实验室开放课题(ICT2022B52)。
年 份:2022
卷 号:56
期 号:6
起止页码:1249-1256
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD2021_2022、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:针对基于深度强化学习的交通信号控制方法存在难以及时更新交叉口信号控制策略的问题,提出基于改进深度强化学习的单交叉口交通信号控制方法.构建新的基于相邻采样时间步实时车辆数变化量的奖励函数,以及时跟踪并利用交叉口交通状态动态的变化过程.采用双网络结构提高算法学习效率,利用经验回放改善算法收敛性.基于SUMO的仿真测试结果表明,相比传统控制方法和深度强化学习方法,所提方法能明显缩短交叉口车辆平均等待时间和平均排队长度,提高交叉口通行效率.
关 键 词:交通信号控制 深度强化学习 奖励函数 经验回放
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...