Changchun Institute of Optics,Fine Mechanics and Physics,CAS
基于改进强化学习的多无人机协同对抗算法研究 | |
张磊; 李姜; 侯进永; 高远; 王烨 | |
2023-05-25 | |
Source Publication | 兵器装备工程学报 |
Volume | 44Issue:05Pages:230-238 |
Abstract | 多无人机的作战协同研究内容主要包含飞行协同、侦察协同及干扰协同,随着无人机数量及协同决策内容的增加,多智能体强化学习模型的状态空间及动作空间维度呈指数增长,多智能体强化学习算法在训练中不易收敛,协同决策水平难以得到显著提升。采用并对多智能体深度确定性策略梯度(MADDPG)算法原理进行模型构建,在此基础上提出了一种选择性经验存储策略的多智能体深度确定性策略梯度(SES-MADDPG)算法。该算法通过设置回收存储标准以及选择性因子,对进入经验池的经验进行选择性存储,以缓解奖励稀疏的问题。仿真实验表明,在保证算法时间复杂度的前提下,SES-MADDPG算法比其他强化学习算法有了更好的收敛效果,相较于MADDPG算法,任务完成率提高了25.427%。 |
Document Type | 期刊论文 |
Identifier | http://ir.ciomp.ac.cn/handle/181722/68430 |
Collection | 中国科学院长春光学精密机械与物理研究所 |
Affiliation | 1.中国科学院长春光学精密机械与物理研究所 2.中国科学院大学 3.32802部队 |
Recommended Citation GB/T 7714 | 张磊,李姜,侯进永,等. 基于改进强化学习的多无人机协同对抗算法研究[J]. 兵器装备工程学报,2023,44(05):230-238. |
APA | 张磊,李姜,侯进永,高远,&王烨.(2023).基于改进强化学习的多无人机协同对抗算法研究.兵器装备工程学报,44(05),230-238. |
MLA | 张磊,et al."基于改进强化学习的多无人机协同对抗算法研究".兵器装备工程学报 44.05(2023):230-238. |
Files in This Item: | Download All | |||||
File Name/Size | DocType | Version | Access | License | ||
基于改进强化学习的多无人机协同对抗算法研(2469KB) | 期刊论文 | 出版稿 | 开放获取 | CC BY-NC-SA | View Download |
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment