地月空间入门指南地月空间入门指南
卫星轨道仿真教学平台
地月空间术语词典
资源与工具
蓝军研究
Space News
AI问答
论坛
首页
Gitee
GitHub
  • 简体中文
  • English
卫星轨道仿真教学平台
地月空间术语词典
资源与工具
蓝军研究
Space News
AI问答
论坛
首页
Gitee
GitHub
  • 简体中文
  • English
  • 全站导览

    • 首页(知识总览)
    • 入门 · 地月空间是什么
    • 轨道 · 飞行器运行轨道
    • 前沿 · 科研方向与机构
    • 术语 · 定义与概念
    • 工具 · 数据与代码
    • 动态 · 航天新闻归档
    • 专题 · 蓝军研究
  • 地月空间术语词典(定义与概念检索)

    • 地月空间术语词典
    • 动力学与数学基础

      • 圆形限制性三体问题(CR3BP)
      • 低推力增强圆形限制性三体问题(CR3BP-LT)
      • A2PPO(注意力增强近端策略优化)
      • 课程学习(Curriculum Learning)
      • 低推力转移的马尔可夫决策过程(MDP) formulation
      • 广义优势估计(GAE)
      • 直接配点法(Direct Collocation)
      • 拟双圆四体问题(QBCP)
      • 星历模型(Ephemeris Model)
      • 作用角变量(Action-Angle Variables)
      • Birkhoff-Gustavson标准型(Birkhoff-Gustavson Normal Form)
      • 中心流形(Central Manifold)
      • 庞加莱截面(Poincaré Section)
      • CW方程(Clohessy-Wiltshire方程)
    • 任务轨道

      • 远距离逆行轨道(DRO)
      • 近直线晕轨道(NRHO)
      • 地月L1/L2晕轨道(EML1/EML2 Halo Orbit)
      • DRO三星座
    • 导航技术与系统

      • X射线脉冲星导航技术
      • 地球GNSS弱信号导航
      • 星间链路导航
      • 地月混合导航
      • 轨道辨识(Orbit Identification)
      • 地月空间时空基准 (Cislunar Spatiotemporal Reference)
      • 月球网(LunaNet)
      • 月光计划
      • 月球导航星座
      • 天都一号
    • 月球矿物

      • 镁嫦娥石
      • 铈嫦娥石
    • 项目与任务

      • 阿尔忒弥斯计划
      • LuGRE实验
    • 其他技术

      • 纵向耦合振动(POGO)
      • EXOSIMS
      • 太空交通管控(STM)
      • 星伞(Starshade)
      • 核热推进(NTP)
      • 地月空间导航发展展望
      • 非合作目标(Noncooperative Target)
      • 航天器意图识别(Spacecraft Intention Recognition)
      • 思维链提示(Chain-of-Thought Prompting)
      • 低秩适配(LoRA — Low-Rank Adaptation)
      • 提示调优(Prompt Tuning / P-tuning)
    • 机构和组织

      • 安杜里尔工业公司
      • 博思艾伦汉密尔顿公司
      • 通用动力任务系统公司
      • GITAI美国公司
      • 洛克希德·马丁公司
      • 诺斯罗普·格鲁曼公司
      • Quindar公司
      • 雷神导弹与防务公司
      • Sci-Tec公司
      • SpaceX公司
      • True Anomaly公司
      • Turion Space公司

低秩适配(LoRA — Low-Rank Adaptation)

本文作者:天疆说

本站地址:https://cislunarspace.cn

定义

低秩适配(Low-Rank Adaptation,简称LoRA)是由Hu等(2021年)提出的一种参数高效微调(Parameter-Efficient Fine-Tuning,PEFT)方法。LoRA的核心思想是:预训练模型的参数更新可以用一个低秩矩阵来有效近似。通过冻结预训练模型的原始权重,仅在每个Transformer层中注入一对可训练的低秩分解矩阵,LoRA能够在仅训练0.1%–3%原始模型参数的情况下,达到与全量微调(Full Fine-Tuning)相近的性能。

数学原理

设预训练模型的某一层权重矩阵为 Φ0∈Rd×k\Phi_0 \in \mathbb{R}^{d \times k}Φ0​∈Rd×k,LoRA将参数更新 Δϕ\Delta\phiΔϕ 分解为两个低秩矩阵的乘积:

Δϕ=AB\Delta\phi = AB Δϕ=AB

其中 A∈Rd×rA \in \mathbb{R}^{d \times r}A∈Rd×r,B∈Rr×kB \in \mathbb{R}^{r \times k}B∈Rr×k,且秩 r≪min⁡(d,k)r \ll \min(d, k)r≪min(d,k)。

前向传播变为:

Y=X(Φ0+Δϕ)=XΦ0+XABY = X(\Phi_0 + \Delta\phi) = X\Phi_0 + XAB Y=X(Φ0​+Δϕ)=XΦ0​+XAB

由于 rrr 远小于 ddd 和 kkk,需要训练的参数量大幅减少。例如,当 d=k=4096d = k = 4096d=k=4096,r=8r = 8r=8 时,原始层有约1680万个参数,而LoRA仅需训练约6.5万个参数(约0.4%)。

训练流程

LoRA的训练分为以下步骤:

  1. 冻结预训练权重:预训练模型的所有原始参数 Φ0\Phi_0Φ0​ 保持不变
  2. 注入低秩矩阵:在每个目标层(通常是注意力层的Q、K、V、O投影矩阵)添加可训练的 AAA 和 BBB 矩阵
  3. 初始化:AAA 通常用高斯随机初始化,BBB 初始化为零矩阵,确保训练开始时 Δϕ=AB=0\Delta\phi = AB = 0Δϕ=AB=0
  4. 训练:仅更新 AAA 和 BBB 的参数,使用标准的梯度下降优化
  5. 推理合并:训练完成后,将 ABABAB 合并到原始权重中:Φ=Φ0+AB\Phi = \Phi_0 + ABΦ=Φ0​+AB,不引入额外的推理延迟

与全量微调的对比

特征全量微调LoRA
可训练参数量100%0.1%–3%
显存需求高低
训练速度慢快
推理延迟无额外延迟无额外延迟(合并后)
多任务支持需要多个完整模型副本可为不同任务训练不同的低秩矩阵
性能最优接近全量微调

与P-tuning V2的对比

LoRA和P-tuning V2都属于参数高效微调方法,但策略不同:

特征LoRAP-tuning V2
参数修改方式在模型外部构建低秩矩阵在模型内部添加软提示和嵌入层
修改位置每个目标层的权重矩阵输入层前的虚拟提示 + 各层嵌入
推理方式合并权重后无额外开销需要处理额外的软提示token
典型应用ChatGLM3-6B微调ChatGLM2-6B微调

在航天器意图识别中的应用

在Jing等(2025年)的研究中,LoRA被用于微调ChatGLM3-6B模型以执行航天器意图识别任务。实验使用LoRA秩 r=8r = 8r=8、缩放因子32,仅训练了约3,000轮迭代。结果表明:

  • LoRA微调的ChatGLM3-6B在指令提示条件下达到了**99.90%**的准确率,是所有测试模型中的最高值
  • 相比基础模型,准确率提升了83.94%
  • 鲁棒性接近基础模型,标准偏差仅增加1.25倍

相关概念

  • 提示调优(P-tuning)
  • 思维链提示(CoT)
  • 航天器意图识别

参考文献

  • Hu E J, Shen Y, Wallis P, et al. LoRA: Low-rank adaptation of large language models. arXiv:2106.09685, 2021.
  • Jing H, Sun Q, Dang Z, Wang H. Intention Recognition of Space Noncooperative Targets Using Large Language Models. Space Sci. Technol. 2025;5:0271.
  • Ling C, Zhao X, Lu J, et al. Domain specialization as the key to make large language models disruptive: A comprehensive survey. arXiv:2305.18703, 2023.
完善页面
最近更新: 2026/4/27 10:22
Contributors: Hermes Agent
Prev
思维链提示(Chain-of-Thought Prompting)
Next
提示调优(Prompt Tuning / P-tuning)
地月空间入门指南
地月空间入门指南探索地月空间知识
在 GitHub 查看

导航

  • 首页
  • 关于本站
  • 航天动态
  • 术语表

内容

  • 地月轨道
  • 研究前沿
  • 资源工具
  • 蓝队研究

English

  • Home
  • About
  • Space News
  • Glossary

关注我们

© 2026 地月空间入门指南  |  湘ICP备2026006405号-1
友情链接:智慧学习助手 UStudy航天任务工具箱 ATK
支持我
鼓励和赞赏我感谢您的支持