CIOMP OpenIR
基于改进强化学习的多无人机协同对抗算法研究
张磊; 李姜; 侯进永; 高远; 王烨
2023-05-25
Source Publication兵器装备工程学报
Volume44Issue:05Pages:230-238
Abstract多无人机的作战协同研究内容主要包含飞行协同、侦察协同及干扰协同,随着无人机数量及协同决策内容的增加,多智能体强化学习模型的状态空间及动作空间维度呈指数增长,多智能体强化学习算法在训练中不易收敛,协同决策水平难以得到显著提升。采用并对多智能体深度确定性策略梯度(MADDPG)算法原理进行模型构建,在此基础上提出了一种选择性经验存储策略的多智能体深度确定性策略梯度(SES-MADDPG)算法。该算法通过设置回收存储标准以及选择性因子,对进入经验池的经验进行选择性存储,以缓解奖励稀疏的问题。仿真实验表明,在保证算法时间复杂度的前提下,SES-MADDPG算法比其他强化学习算法有了更好的收敛效果,相较于MADDPG算法,任务完成率提高了25.427%。
Document Type期刊论文
Identifierhttp://ir.ciomp.ac.cn/handle/181722/68430
Collection中国科学院长春光学精密机械与物理研究所
Affiliation1.中国科学院长春光学精密机械与物理研究所
2.中国科学院大学
3.32802部队
Recommended Citation
GB/T 7714
张磊,李姜,侯进永,等. 基于改进强化学习的多无人机协同对抗算法研究[J]. 兵器装备工程学报,2023,44(05):230-238.
APA 张磊,李姜,侯进永,高远,&王烨.(2023).基于改进强化学习的多无人机协同对抗算法研究.兵器装备工程学报,44(05),230-238.
MLA 张磊,et al."基于改进强化学习的多无人机协同对抗算法研究".兵器装备工程学报 44.05(2023):230-238.
Files in This Item: Download All
File Name/Size DocType Version Access License
基于改进强化学习的多无人机协同对抗算法研(2469KB)期刊论文出版稿开放获取CC BY-NC-SAView Download
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[张磊]'s Articles
[李姜]'s Articles
[侯进永]'s Articles
Baidu academic
Similar articles in Baidu academic
[张磊]'s Articles
[李姜]'s Articles
[侯进永]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[张磊]'s Articles
[李姜]'s Articles
[侯进永]'s Articles
Terms of Use
No data!
Social Bookmark/Share
File name: 基于改进强化学习的多无人机协同对抗算法研究.pdf
Format: Adobe PDF
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.