追逃防(Pursuit-Evasion-Defense Game)
本文作者:天疆说
本文根据张乘铭(2021)《航天器追逃博弈制导策略研究》整理。
定义
追逃防是经典二人追逃博弈问题的三方扩展。在追逃防问题中,除追踪方和逃逸方外,还存在一个防御方参与博弈。防御方的目标是在协助逃逸方的同时,避免被追踪方捕获,或保护己方高价值资产。
该问题的提出背景是:逃逸方(通常是具有高价值的航天器)在执行逃逸机动时会消耗大量燃料,对航天器设计和运载能力提出很高要求。引入防御方可以帮助逃逸方完成防御任务,同时降低逃逸方的燃料消耗。
问题模型
三方角色
| 角色 | 目标 | 典型场景 |
|---|---|---|
| 追踪方 | 捕获逃逸方 | 敌方拦截器、追击卫星 |
| 逃逸方 | 避免被捕获 | 高价值卫星、空间站 |
| 防御方 | 协助逃逸方躲避追踪方 | 护卫卫星、防御系统 |
博弈结构
追逃防问题可分解为两个二人零和子博弈:
- 追踪方 vs 逃逸方(追逃博弈)
- 防御方 vs 追踪方(攻防博弈)
三方博弈的复杂性在于各方的策略相互耦合,需考虑多智能体的协调决策。
求解方法
基于零控脱靶量的建模
张乘铭(2021)提出基于零控脱靶量(ZEM)的追逃防问题建模方法:
- 建立追踪方与逃逸方、防御方的相对运动方程
- 实时计算追踪方对逃逸方和对防御方的ZEM
- 基于ZEM评估追踪方受威胁程度
- 设计追踪方的制导策略,使其在躲避防御方的同时捕获逃逸方
模糊综合评价方法
针对追逃防问题中的不确定性,采用模糊综合评价方法:
- 因素集建立:建立影响追踪方决策的因素集
- 隶属函数:建立各因素对威胁等级的隶属函数
- 权重确定:确定各因素的权重分配
- 模糊评判:得到追踪方受威胁程度的模糊评价结果
- 制导决策:根据威胁等级选择相应控制策略
协同优化
防御方的任务规划需考虑:
- 分布式在线任务规划算法
- 纳什均衡理论的任务分配
- 轨道机动的协同优化
技术挑战
合作与竞争关系评估
防御方与逃逸方存在合作关系,但防御资源有限,需要评估不同角色之间的合作或竞争关系,以及对其他方的威胁程度。
求解维度爆炸
三人博弈的问题维度远高于二人博弈,鞍点策略的存在性和求解方法更加复杂。
实时性要求
实际应用中需要实时或近实时决策,对计算效率提出很高要求。
应用场景
- 卫星防护:高价值卫星配备防御系统对抗敌方接近
- 空间站安全:空间站防御系统保护航天员和设施
- 反卫星作战:攻防双方的战略博弈
- 多智能体协同:无人机集群的攻防任务规划
发展前沿
- 多航天器追逃防问题(多方参与)
- 随机因素和不确定性建模
- 深度强化学习在多方博弈中的应用
- 追逃防策略的鲁棒性分析
参考文献
- 张乘铭. 航天器追逃博弈制导策略研究[D]. 国防科技大学, 2021.
- Li J, et al. Pursuit-Evasion-Defense Game with Defender[C]. AIAA Guidance, Navigation, and Control Conference, 2015.
- Liu Y, et al. Distributed Task Planning for Spacecraft Formation with Fuzzy Evaluation[C]. IEEE Transactions on Aerospace and Electronic Systems, 2018.
