登录    注册    忘记密码

期刊文章详细信息

协作多智能体深度强化学习研究综述    

An Overview of Cooperative Multi-Agent Deep Reinforcement Learning

  

文献类型:期刊文章

作  者:邹启杰[1] 蒋亚军[1] 高兵[1] 李文雪[1] 张汝波[2]

Zou Qijie;Jiang Yajun;Gao Bing;Li Wenxue;Zhang Rubo(Department of Information Engineering,Dalian University,Dalian 116000,China;Department of Mechanical and Electrical Engineering,Dalian Minzu University,Dalian 116000,China)

机构地区:[1]大连大学信息工程学院,辽宁大连116000 [2]大连民族大学机电工程学院,辽宁大连116000

出  处:《航空兵器》

基  金:国家自然科学基金项目(61673084);辽宁省科学研究项目(LJKZ1180)。

年  份:2022

卷  号:29

期  号:6

起止页码:78-88

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、DOAJ、JST、RCCSE、ZGKJHX、核心刊

摘  要:多智能体系统是由多个智能体与环境交互组成的分布式决策系统,是分布式人工智能的一个重要研究方向,在复杂未知的现实社会具有广阔的应用前景,如工业、农业、军事和航空航天等群体机器人系统,以及交通控制、资源管理、商业金融和游戏AI等。多智能体强化学习(Multi-Agent Reinforcement Learning,MARL)依托强化学习在未知环境中的序贯决策能力,融合了运筹学、博弈论和群体心理学等众多学科,能够更好地发挥多个智能体的协同优势,进而低成本、高效率地完成复杂任务。本文着重针对无通信环境下的协作多智能体深度强化学习研究成果进行分析、对比和展望。首先,介绍了MARL的研究背景及其学习任务的分类。其次,根据MARL重点研究内容,将多智能体强化学习算法分为价值分解、 Actor-Critic和经验回放三个类别加以剖析,并从环境非平稳性、信度分配和收敛性能等不同角度对比算法差异性。最后,分析了MARL领域未来研究所面临的一些挑战,并对MARL的应用和前景进行展望。

关 键 词:多智能体 深度学习  强化学习  协作学习  价值分解  Actor-Critic  经验回放  

分 类 号:TJ760] TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心