地月空间入门指南地月空间入门指南
卫星轨道仿真教学平台
地月空间术语词典
资源与工具
蓝军研究
Space News
AI问答
论坛
首页
Gitee
GitHub
  • 简体中文
  • English
卫星轨道仿真教学平台
地月空间术语词典
资源与工具
蓝军研究
Space News
AI问答
论坛
首页
Gitee
GitHub
  • 简体中文
  • English
  • 全站导览

    • 首页(知识总览)
    • 入门 · 地月空间是什么
    • 轨道 · 飞行器运行轨道
    • 前沿 · 科研方向与机构
    • 术语 · 定义与概念
    • 工具 · 数据与代码
    • 动态 · 航天新闻归档
    • 专题 · 蓝军研究
  • 地月空间术语词典(定义与概念检索)

    • 地月空间术语词典
    • 动力学与数学基础

      • 圆形限制性三体问题(CR3BP)
      • 低推力增强圆形限制性三体问题(CR3BP-LT)
      • A2PPO(注意力增强近端策略优化)
      • 课程学习(Curriculum Learning)
      • 低推力转移的马尔可夫决策过程(MDP) formulation
      • 广义优势估计(GAE)
      • 直接配点法(Direct Collocation)
      • 拟双圆四体问题(QBCP)
      • 星历模型(Ephemeris Model)
      • 作用角变量(Action-Angle Variables)
      • Birkhoff-Gustavson标准型(Birkhoff-Gustavson Normal Form)
      • 中心流形(Central Manifold)
      • 庞加莱截面(Poincaré Section)
      • CW方程(Clohessy-Wiltshire方程)
    • 任务轨道

      • 远距离逆行轨道(DRO)
      • 近直线晕轨道(NRHO)
      • 地月L1/L2晕轨道(EML1/EML2 Halo Orbit)
      • DRO三星座
    • 导航技术与系统

      • X射线脉冲星导航技术
      • 地球GNSS弱信号导航
      • 星间链路导航
      • 地月混合导航
      • 轨道辨识(Orbit Identification)
      • 地月空间时空基准 (Cislunar Spatiotemporal Reference)
      • 月球网(LunaNet)
      • 月光计划
      • 月球导航星座
      • 天都一号
    • 月球矿物

      • 镁嫦娥石
      • 铈嫦娥石
    • 项目与任务

      • 阿尔忒弥斯计划
      • LuGRE实验
    • 其他技术

      • 纵向耦合振动(POGO)
      • EXOSIMS
      • 太空交通管控(STM)
      • 星伞(Starshade)
      • 核热推进(NTP)
      • 地月空间导航发展展望
      • 非合作目标(Noncooperative Target)
      • 航天器意图识别(Spacecraft Intention Recognition)
      • 思维链提示(Chain-of-Thought Prompting)
      • 低秩适配(LoRA — Low-Rank Adaptation)
      • 提示调优(Prompt Tuning / P-tuning)
    • 机构和组织

      • 安杜里尔工业公司
      • 博思艾伦汉密尔顿公司
      • 通用动力任务系统公司
      • GITAI美国公司
      • 洛克希德·马丁公司
      • 诺斯罗普·格鲁曼公司
      • Quindar公司
      • 雷神导弹与防务公司
      • Sci-Tec公司
      • SpaceX公司
      • True Anomaly公司
      • Turion Space公司

提示调优(Prompt Tuning / P-tuning)

本文作者:天疆说

本站地址:https://cislunarspace.cn

定义

提示调优(Prompt Tuning)是一类参数高效微调(PEFT)技术,其核心思想是在模型输入前添加一组可学习的连续向量(称为"软提示",soft prompt),同时冻结预训练模型的原始权重,仅训练软提示的参数。通过这种方式,模型可以在不修改自身参数的情况下,适应不同的下游任务。

P-tuning是提示调优的一种重要变体,由Liu等提出。P-tuning V2(2021年)是其改进版本,在多个尺度和任务上都能达到与全量微调相当的性能。

P-tuning V2 原理

P-tuning V2的工作流程如下:

  1. 输入处理:将输入文本 XXX 经过分词(tokenization)和嵌入(embedding)转换为向量序列 {h1,h2,...,hn}\{h_1, h_2, ..., h_n\}{h1​,h2​,...,hn​}
  2. 添加软提示:在输入向量前拼接128个可学习的软提示token S1,S2,...,S128S_1, S_2, ..., S_{128}S1​,S2​,...,S128​
  3. 逐层嵌入:在LLM的每一层中构建与软提示token对应的可训练嵌入参数
  4. 训练:仅更新软提示token和逐层嵌入的参数,原始模型权重 Φ0\Phi_0Φ0​ 保持不变

输入模板为:

Tinput={S1,S2,…,S128,h1,h2,…,hn}T_{\text{input}} = \{S_1, S_2, \ldots, S_{128}, h_1, h_2, \ldots, h_n\} Tinput​={S1​,S2​,…,S128​,h1​,h2​,…,hn​}

最终模型参数为原始参数与新增参数的组合:

Φ=Φ0+Δϕ\Phi = \Phi_0 + \Delta\phi Φ=Φ0​+Δϕ

其中 Δϕ\Delta\phiΔϕ 是通过训练优化的新增参数。

与硬提示的区别

提示调优中的"软提示"与常见的"硬提示"(hard prompt,即自然语言文本提示)有本质区别:

特征硬提示(Hard Prompt)软提示(Soft Prompt)
形式自然语言文本连续向量空间中的可学习参数
优化方式人工设计或搜索梯度下降自动优化
表达能力受限于词表中的离散token可表示词表中不存在的连续语义
适用场景通用交互、零样本推理特定任务的高效适配

与全量微调和LoRA的对比

特征全量微调P-tuning V2LoRA
可训练参数量100%<1%0.1%–3%
修改位置所有层输入层 + 逐层嵌入目标层权重矩阵
推理开销无额外处理软提示token无(合并后)
典型模型任意ChatGLM2-6BChatGLM3-6B

在航天器意图识别中的应用

在Jing等(2025年)的研究中,P-tuning V2被用于微调ChatGLM2-6B模型。训练使用128个软提示token、学习率0.02、最大输入长度256个token、最大输出长度128个token。实验结果表明:

  • P-tuning V2微调的ChatGLM2-6B在CoT提示条件下达到了**99.81%**的准确率
  • 相比基础模型,准确率显著提升
  • CoT提示微调后的模型在鲁棒性测试中表现最优,标准偏差接近基础模型

相关概念

  • 低秩适配(LoRA)
  • 思维链提示(CoT)
  • 航天器意图识别

参考文献

  • Liu X, Ji K, Fu Y, et al. P-tuning v2: Prompt tuning can be comparable to fine-tuning universally across scales and tasks. arXiv:2110.07602, 2021.
  • Liu P, Yuan W, Fu J, et al. Pretrain, prompt, and predict: A systematic survey of prompting methods in natural language processing. ACM Comput Surv. 2023;55(9):1-35.
  • Jing H, Sun Q, Dang Z, Wang H. Intention Recognition of Space Noncooperative Targets Using Large Language Models. Space Sci. Technol. 2025;5:0271.
完善页面
最近更新: 2026/4/27 10:22
Contributors: Hermes Agent
Prev
低秩适配(LoRA — Low-Rank Adaptation)
地月空间入门指南
地月空间入门指南探索地月空间知识
在 GitHub 查看

导航

  • 首页
  • 关于本站
  • 航天动态
  • 术语表

内容

  • 地月轨道
  • 研究前沿
  • 资源工具
  • 蓝队研究

English

  • Home
  • About
  • Space News
  • Glossary

关注我们

© 2026 地月空间入门指南  |  湘ICP备2026006405号-1
友情链接:智慧学习助手 UStudy航天任务工具箱 ATK
支持我
鼓励和赞赏我感谢您的支持