Changchun Institute of Optics,Fine Mechanics and Physics,CAS
基于强化学习的多智能体协同电子对抗方法 | |
杨洋; 王烨; 康大勇; 陈嘉玉; 李姜![]() | |
2024-07-15 | |
发表期刊 | 兵器装备工程学报
![]() |
卷号 | 45期号:07页码:1-10 |
摘要 | 传统电子战正逐步向融合人工智能技术的智能电子战演变,基于强化学习的多无人机电子协同对抗为主要场景,针对复杂高维的状态动作空间下多智能体强化学习算法不容易收敛问题,提出了一种基于优先经验回放的多智能体双对抗策略梯度算法。该算法通过引入优先经验回放机制,并提出对抗Critic网络和双Critic网络来平衡动作及价值间的关系和减小单一Critic网络估计不确定性的问题。仿真实验结果表明:在同一仿真场景下相较于其他强化学习算法,PerMaD4算法具有更好的收敛效果且任务完成度提高了8.9%。 |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ciomp.ac.cn/handle/181722/68663 |
专题 | 中国科学院长春光学精密机械与物理研究所 |
作者单位 | 1.中国科学院长春光学精密机械与物理研究所 2.中国科学院大学 3.光电对抗测试评估技术重点实验室 |
推荐引用方式 GB/T 7714 | 杨洋,王烨,康大勇,等. 基于强化学习的多智能体协同电子对抗方法[J]. 兵器装备工程学报,2024,45(07):1-10. |
APA | 杨洋,王烨,康大勇,陈嘉玉,李姜,&赵华栋.(2024).基于强化学习的多智能体协同电子对抗方法.兵器装备工程学报,45(07),1-10. |
MLA | 杨洋,et al."基于强化学习的多智能体协同电子对抗方法".兵器装备工程学报 45.07(2024):1-10. |
条目包含的文件 | 下载所有文件 | |||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
基于强化学习的多智能体协同电子对抗方法.(655KB) | 期刊论文 | 出版稿 | 开放获取 | CC BY-NC-SA | 浏览 下载 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[杨洋]的文章 |
[王烨]的文章 |
[康大勇]的文章 |
百度学术 |
百度学术中相似的文章 |
[杨洋]的文章 |
[王烨]的文章 |
[康大勇]的文章 |
必应学术 |
必应学术中相似的文章 |
[杨洋]的文章 |
[王烨]的文章 |
[康大勇]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论