微分对策(Differential Games)
本文作者:天疆说
本文根据张乘铭(2021)《航天器追逃博弈制导策略研究》整理。
定义
微分对策是运筹学与控制理论的交叉分支,研究在连续时间动态系统中,多个决策者(局中人)之间的对抗或合作关系。当对抗各方目标完全相反(一方所得即另一方所失)时,称为零和微分对策。微分对策理论为航天器追逃、导弹拦截、无人机空战等问题提供了严格的数学建模与求解框架。
历史沿革
- 1965年:美国兰德公司数学家Isaacs出版专著,奠定了微分对策的数学理论基础
- 1971年:Friedman采用离散对策逼近序列定义了微分对策,证明了鞍点存在性条件
- 20世纪70-80年代:微分对策在军事领域(空战、导弹拦截)得到广泛应用
- 近年来:与模糊控制、强化学习、深度神经网络等技术结合,解决高维复杂博弈问题
核心要素
基本分类
根据不同划分方法,微分对策可分为:
| 分类维度 | 类型 |
|---|---|
| 信息结构 | 完全信息微分对策、不完全信息微分对策 |
| 随机性 | 确定微分对策、随机微分对策 |
| 局中人数 | 二人微分对策、多人微分对策 |
| 目标函数 | 零和微分对策、非零和微分对策 |
关键概念
- 鞍点策略:零和微分对策中,双方在鞍点处均无法单方面改进策略
- 支付函数:衡量博弈结果的性能指标,零和对策中一方的损失即另一方的收益
- 协态变量:伴随状态变量变化的辅助变量,用于推导最优性必要条件
- 两点边值问题:追逃对策转化为的数学问题形式,是求解鞍点策略的核心难点
与最优控制的关系
微分对策与最优控制密切相关。当博弈中只有一个决策者时,微分对策退化为最优控制问题。最优控制的极小值原理(Maximum Principle)可视为微分对策的特例。在追逃问题中,基于微分对策理论推导的鞍点制导律与基于最优控制理论设计的制导律在形式上具有一致性。
应用领域
- 航天器追逃博弈:轨道交会接近操作中的对抗性机动策略设计
- 导弹拦截:空空导弹、空地导弹的制导律设计
- 无人机集群协同:多智能体系统的博弈决策
- 深空探测:探测器抵近小行星、彗星的任务规划
参考文献
- Isaacs R. Differential Games: A Mathematical Theory with Applications to Warfare and Pursuit, Optimization and Control[M]. John Wiley & Sons, 1965.
- Friedman A. Differential Games[M]. American Mathematical Society, 1971.
- 张乘铭. 航天器追逃博弈制导策略研究[D]. 国防科技大学, 2021.
