中国科学院长春光学精密机械与物理研究所

Changchun Institute of Optics,Fine Mechanics and Physics,CAS

图片搜索

粘贴图片网址

CIOMP OpenIR

	基于改进强化学习的多无人机协同对抗算法研究
	张磊 ; 李姜 ; 侯进永 ; 高远 ; 王烨
	2023-05-25
发表期刊	兵器装备工程学报
卷号	44 期号:05 页码:230-238
摘要	多无人机的作战协同研究内容主要包含飞行协同、侦察协同及干扰协同，随着无人机数量及协同决策内容的增加，多智能体强化学习模型的状态空间及动作空间维度呈指数增长，多智能体强化学习算法在训练中不易收敛，协同决策水平难以得到显著提升。采用并对多智能体深度确定性策略梯度(MADDPG)算法原理进行模型构建，在此基础上提出了一种选择性经验存储策略的多智能体深度确定性策略梯度(SES-MADDPG)算法。该算法通过设置回收存储标准以及选择性因子，对进入经验池的经验进行选择性存储，以缓解奖励稀疏的问题。仿真实验表明，在保证算法时间复杂度的前提下，SES-MADDPG算法比其他强化学习算法有了更好的收敛效果，相较于MADDPG算法，任务完成率提高了25.427%。
文献类型	期刊论文
条目标识符	http://ir.ciomp.ac.cn/handle/181722/68430
专题	中国科学院长春光学精密机械与物理研究所
作者单位	1.中国科学院长春光学精密机械与物理研究所 2.中国科学院大学 3.32802部队
推荐引用方式 GB/T 7714	张磊,李姜,侯进永,等. 基于改进强化学习的多无人机协同对抗算法研究[J]. 兵器装备工程学报,2023,44(05):230-238.
APA	张磊,李姜,侯进永,高远,&王烨.(2023).基于改进强化学习的多无人机协同对抗算法研究.兵器装备工程学报,44(05),230-238.
MLA	张磊,et al."基于改进强化学习的多无人机协同对抗算法研究".兵器装备工程学报 44.05(2023):230-238.

条目包含的文件		下载所有文件
文件名称/大小	文献类型	版本类型	开放类型	使用许可
基于改进强化学习的多无人机协同对抗算法研（2469KB）	期刊论文	出版稿	开放获取	CC BY-NC-SA	浏览下载

个性服务

保存到收藏夹

查看访问统计

导出为Endnote文件

谷歌学术

谷歌学术中相似的文章

[张磊]的文章

[李姜]的文章

[侯进永]的文章

百度学术

百度学术中相似的文章

[张磊]的文章

[李姜]的文章

[侯进永]的文章

必应学术

必应学术中相似的文章

[张磊]的文章

[李姜]的文章

[侯进永]的文章

相关权益政策

收藏/分享

文件名：	基于改进强化学习的多无人机协同对抗算法研究.pdf
格式：	Adobe PDF

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量29917
全文量28375
访问量13358408
下载量2880612
中科维智（cas）