地月空间入门指南地月空间入门指南
卫星轨道仿真教学平台
地月空间术语词典
资源与工具
蓝军研究
Space News
AI问答
论坛
首页
Gitee
GitHub
  • 简体中文
  • English
卫星轨道仿真教学平台
地月空间术语词典
资源与工具
蓝军研究
Space News
AI问答
论坛
首页
Gitee
GitHub
  • 简体中文
  • English
  • 全站导览

    • 首页(知识总览)
    • 入门 · 地月空间是什么
    • 轨道 · 飞行器运行轨道
    • 前沿 · 科研方向与机构
    • 术语 · 定义与概念
    • 工具 · 数据与代码
    • 动态 · 航天新闻归档
    • 专题 · 蓝军研究
  • 地月空间术语词典(定义与概念检索)

    • 地月空间术语词典
    • 动力学与数学基础

      • 圆形限制性三体问题(CR3BP)
      • 低推力增强圆形限制性三体问题(CR3BP-LT)
      • A2PPO(注意力增强近端策略优化)
      • 课程学习(Curriculum Learning)
      • 低推力转移的马尔可夫决策过程(MDP) formulation
      • 广义优势估计(GAE)
      • 直接配点法(Direct Collocation)
      • 拟双圆四体问题(QBCP)
      • 星历模型(Ephemeris Model)
      • 作用角变量(Action-Angle Variables)
      • Birkhoff-Gustavson标准型(Birkhoff-Gustavson Normal Form)
      • 中心流形(Central Manifold)
      • 庞加莱截面(Poincaré Section)
    • 任务轨道

      • 远距离逆行轨道(DRO)
      • 近直线晕轨道(NRHO)
      • 地月L1/L2晕轨道(EML1/EML2 Halo Orbit)
      • DRO三星座
    • 导航技术与系统

      • X射线脉冲星导航技术
      • 地球GNSS弱信号导航
      • 星间链路导航
      • 地月混合导航
      • 轨道辨识(Orbit Identification)
      • 地月空间时空基准 (Cislunar Spatiotemporal Reference)
      • 月球网(LunaNet)
      • 月光计划
      • 月球导航星座
      • 天都一号
    • 月球矿物

      • 镁嫦娥石
      • 铈嫦娥石
    • 项目与任务

      • 阿尔忒弥斯计划
      • LuGRE实验
    • 其他技术

      • 纵向耦合振动(POGO)
      • EXOSIMS
      • 太空交通管控(STM)
      • 星伞(Starshade)
      • 核热推进(NTP)
      • 地月空间导航发展展望
    • 机构和组织

      • 安杜里尔工业公司
      • 博思艾伦汉密尔顿公司
      • 通用动力任务系统公司
      • GITAI美国公司
      • 洛克希德·马丁公司
      • 诺斯罗普·格鲁曼公司
      • Quindar公司
      • 雷神导弹与防务公司
      • Sci-Tec公司
      • SpaceX公司
      • True Anomaly公司
      • Turion Space公司

直接配点法(Direct Collocation)

定义

直接配点法(Direct Collocation)是一类将最优控制问题(OCP)直接离散化为非线性规划问题(NLP)进行数值求解的方法[1]。与间接法(indirect method)需要解析推导共状态(costate)的一阶最优性条件不同,直接法通过配点(collocation)方式同时离散化状态和控制变量,将无限维连续最优控制问题转化为有限维的 NLP,是当前航天器轨迹优化领域最广泛使用的数值方法之一。

基本原理

离散化策略

在直接配点法中,转移区间 [0,tf][0, t_f][0,tf​] 被划分为 NNN 个子区间,在每个子区间的配点处同时满足:

  1. 状态动力学约束:在配点处强制执行 x˙=f(x,u)\dot{\mathbf{x}} = f(\mathbf{x}, \mathbf{u})x˙=f(x,u)
  2. 边界条件:初态 x(0)=x0\mathbf{x}(0) = \mathbf{x}_0x(0)=x0​ 和终端约束 x(tf)∈T\mathbf{x}(t_f) \in \mathcal{T}x(tf​)∈T
  3. 路径约束:控制约束 ∥u∥≤1\|\mathbf{u}\| \leq 1∥u∥≤1、避免障碍约束等

Hermite-Simpson 配点

A2PPO 研究中采用的直接配点实现使用 Hermite-Simpson 配点格式[2]:

  • 在每个子区间 [ti,ti+1][t_i, t_{i+1}][ti​,ti+1​] 上,用三次 Hermite 多项式插值状态
  • 在区间中点 ti+1/2t_{i+1/2}ti+1/2​ 处施加动力学缺陷约束(defect constraint)
  • 配点处状态精度为三阶,缺陷约束精度为三阶

与 A2PPO 的对比

Ul Haq 等人(2026)将 A2PPO 策略产生的轨迹作为直接配点法的初始猜测,验证了两者在四个场景中的一致性[2]:

场景A2PPO ToF (天)直接配点 ToF (天)A2PPO 燃料 (kg)直接配点燃料 (kg)
S14.954.992.081.28
S28.387.265.005.29
S37.607.635.105.11
S433.633.120.970.97

直接配点法由于利用了完整的连续最优性条件,通常能达到更优的燃料效率,但:

  • 需要良好的初始猜测(A2PPO 提供了高质量初始解)
  • 计算成本高,每次转移需重新求解
  • 无法实时在线计算

A2PPO 则可在训练后实时推理,提供近即时的轨迹解。

直接法 vs 间接法

特性直接配点法间接法
推导难度较低(无需解析共状态方程)较高(需推导 PMP)
初始猜测较鲁棒敏感(对共状态初值)
解的精度较高极高(满足一阶最优性)
收敛性较好依赖初始猜测质量
计算效率中等(NLP 求解器如 Ipopt)较高(但收敛域窄)

NLP 求解器

直接配点法离散化后的 NLP 通常使用序列二次规划(SQP)或内点法求解器:

  • Ipopt:基于内点法的大规模非线性规划求解器
  • SNOPT:序列二次规划求解器
  • CasADi:符号计算框架,便于构建 NLP 并调用上述求解器

参考文献

  • [1] Betts J T. Survey of numerical methods for trajectory optimization[J]. Journal of Guidance, Control, and Dynamics, 1998.
  • [2] Ul Haq I U, Dai H, Du C. Autonomous low-thrust trajectory optimization in cislunar space via attention-augmented reinforcement learning[J]. Aerospace Science and Technology, 2026.
  • [3] Hargraves C R, Paris S W. Direct trajectory optimization using nonlinear programming and collocation[J]. Journal of Guidance, Control, and Dynamics, 1987.
完善页面
最近更新: 2026/4/27 08:30
Contributors: Hermes Agent
Prev
广义优势估计(GAE)
Next
拟双圆四体问题(QBCP)
地月空间入门指南
地月空间入门指南探索地月空间知识
在 GitHub 查看

导航

  • 首页
  • 关于本站
  • 航天动态
  • 术语表

内容

  • 地月轨道
  • 研究前沿
  • 资源工具
  • 蓝队研究

English

  • Home
  • About
  • Space News
  • Glossary

关注我们

© 2026 地月空间入门指南  |  湘ICP备2026006405号-1
友情链接:智慧学习助手 UStudy航天任务工具箱 ATK
支持我
鼓励和赞赏我感谢您的支持