Changchun Institute of Optics,Fine Mechanics and Physics,CAS
基于改进强化学习的多无人机协同对抗算法研究 | |
张磊; 李姜; 侯进永; 高远; 王烨 | |
2023-05-25 | |
发表期刊 | 兵器装备工程学报 |
卷号 | 44期号:05页码:230-238 |
摘要 | 多无人机的作战协同研究内容主要包含飞行协同、侦察协同及干扰协同,随着无人机数量及协同决策内容的增加,多智能体强化学习模型的状态空间及动作空间维度呈指数增长,多智能体强化学习算法在训练中不易收敛,协同决策水平难以得到显著提升。采用并对多智能体深度确定性策略梯度(MADDPG)算法原理进行模型构建,在此基础上提出了一种选择性经验存储策略的多智能体深度确定性策略梯度(SES-MADDPG)算法。该算法通过设置回收存储标准以及选择性因子,对进入经验池的经验进行选择性存储,以缓解奖励稀疏的问题。仿真实验表明,在保证算法时间复杂度的前提下,SES-MADDPG算法比其他强化学习算法有了更好的收敛效果,相较于MADDPG算法,任务完成率提高了25.427%。 |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ciomp.ac.cn/handle/181722/68430 |
专题 | 中国科学院长春光学精密机械与物理研究所 |
作者单位 | 1.中国科学院长春光学精密机械与物理研究所 2.中国科学院大学 3.32802部队 |
推荐引用方式 GB/T 7714 | 张磊,李姜,侯进永,等. 基于改进强化学习的多无人机协同对抗算法研究[J]. 兵器装备工程学报,2023,44(05):230-238. |
APA | 张磊,李姜,侯进永,高远,&王烨.(2023).基于改进强化学习的多无人机协同对抗算法研究.兵器装备工程学报,44(05),230-238. |
MLA | 张磊,et al."基于改进强化学习的多无人机协同对抗算法研究".兵器装备工程学报 44.05(2023):230-238. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
基于改进强化学习的多无人机协同对抗算法研(2469KB) | 期刊论文 | 出版稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[张磊]的文章 |
[李姜]的文章 |
[侯进永]的文章 |
百度学术 |
百度学术中相似的文章 |
[张磊]的文章 |
[李姜]的文章 |
[侯进永]的文章 |
必应学术 |
必应学术中相似的文章 |
[张磊]的文章 |
[李姜]的文章 |
[侯进永]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论