网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于模型预测Stackelberg主从博弈的导弹制导律  PDF

  • 杜林泽
  • 周聪
  • 李超勇
浙江大学电气工程学院,杭州 310027

中图分类号: TJ765.3

最近更新:2025-03-07

DOI:10.16356/j.1005-2615.2025.01.018

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

随着战术目标智能化水平和机动能力的提高,传统的以比例导引律为代表的开环制导策略已难以满足未来高机动强博弈拦截对抗的战术需求。本文基于模型预测和Stackelberg主从博弈思想,将制导对抗问题转换为博弈优化问题,从而将最优制导指令的生成变成博弈平衡点的快速搜索问题,并引入有效集法,兼容弹目非线性动力学模型和过程约束,可以保证博弈均衡点的有限次可达,从而保证了指令的实时性。仿真结果表明,与传统制导律相比,本制导律能显著提高在强博弈场景下的拦截精度与成功率。

随着战术目标智能化水平与机动能力的不断提高,未来战争中战术目标的拦截对抗需求将呈现出高机动、强博弈的特征。在拦截弹与战术目标的博弈对抗中,拦截弹追求以最小脱靶量命中目标,而目标飞行器则寻求以最大脱靶量规避拦截弹。在此背景下,传统的制导律已难以满足日益复杂的战术拦截需

1。鉴于此,基于博弈论的智能制导律因其最优指令生成能力在对抗中显示出了明显优势。同时,由于导弹自身复杂的气动特性,制导律设计过程中必须充分考虑导弹与目标的非线性动力学对最优指令的影响。

经典的比例导引

2⁃4、微分博弈制导5以及其他能给出解析指令的制导6⁃7大多基于线性化相对动力学。虽然此类策略能够实时给出制导指令,但对非线性模型兼容性不足,也未能充分考虑导弹在长时高速飞行中的动态特性,从而导致其制导精度和拦截成功率欠佳。

近年来,模型预测静态规划(Model predictive static programming, MPSP

8方法因其对非线性动力学模型的良好兼容性以及控制指令生成速度的可控性受到了制导与控制领域的广泛关注。在导弹制导领域,基于MPSP的计算制导策略一般用导弹与目标非线性动力学模型预测来逼近终端时刻的状态/输出,并通过迭代方式更新导弹控制量,在有限迭代次数以内收敛至最优解,实现基于导弹自身非线性动力学模型的最优制导。自MPSP方法提出以来,研究人员对MPSP方法进行了大量的改良研9⁃10。Zhou11提出了配点离散方法,大大减少了经典MPSP方法所需的离散点数。在缩短计算时间的同时,将有效集法与采用了配点离散的MPSP方法结合,在中制导问题中取得了较好的效果。Mondal12则在MPSP迭代过程中考虑前置角状态约束,使目标飞行器在制导过程中始终保持在拦截弹视场内部,且拦截弹指令加速度不超过指定上限。周13将变分线性化方法与MPSP方法相结合,提出了增强型伪谱MPSP方法,实现了多约束条件下初中末多阶段最优制导的快速求解。然而,上述方法虽然在计算提速、约束处理等方面对经典MPSP方法进行了有效改进,但问题仍局限于单边优化,作为开环制导策略,面对强博弈目标仍然存在局限性。

此外,计算博弈方法近年也开始应用于无人机集群与航天器博弈对抗等领域中。这些方法能够兼容较为复杂的对象动力学系统,并且能够有效求解博弈问题。例如,Zhang

14和Liu15分别使用主/被动搜索(Action‑reaction search, ARS)方法解决了无人机集群任务分配博弈问题与航天器追逃博弈问题。Liu16则将MPSP方法框架与Stackelberg博17相结合,并将其用于解决航天器追逃博弈问题。然而,上述计算博弈方法往往只能有效考虑一步决策,在实际对抗中面对高机动强博弈战术目标时,由于缺乏对多步决策的考虑,这些方法在应对快速变化的战场环境方面往往存在局限。

鉴于此,本文在现有研究成果基础上,进一步探索MPSP与博弈论的结合,提出一种基于模型预测Stackelberg博弈(Model predictive Stackelberg game, MPSG)的导弹末制导律。本文的主要工作包括:(1)在现有基于Stackelberg博弈与MPSP的博弈问题求解方法基础上引入有效集法与多步决策,使弹目追逃博弈的求解过程可考虑拦截弹最大过载约束,同时可进行更长时间范围的控制序列规划;(2)针对每个离散时刻指令加速度大小必须小于指定值的非线性约束,给出了一种约束松弛方法,将其转变为线性不等式约束,从而显著降低计算复杂度;(3)将Stackelberg博弈框架与MPSP相结合并改进,提出MPSG方法,给出基于MPSG的计算博弈制导律,实现了对高机动强博弈目标的预测博弈制导。仿真结果证明了本文方法的有效性。

1 基于MPSG的制导律原理

MPSP方法能够处理系统的非线性特性,并在有限的计算资源下提供快速的控制决策,而Stackelberg博弈理论则提供了一种层级决策框架,适用于存在领导者和追随者的博弈场景。在这种博弈中,领导者首先做出决策,追随者随后根据领导者的决策做出最优响应。受到基于MPSP的航天器轨道博弈方

16的启发,本文指定目标飞行器为领导者,导弹为追随者,使得Stackelberg博弈框架能够适用于拦截弹与目标飞行器的追逃博弈问题。

本文提出的MPSG方法是一种将MPSP方法与Stackelberg博弈理论相结合,用于求解基于弹目非线性动力学系统的博弈问题的方法。本节将首先给出MPSG方法的数学推导,随后给出基于MPSG方法的制导律设计方案。

1.1 算法原理

1.1.1 指标函数定义

仿照MPSP方法的思路,设弹目动力学状态方程与弹目复合动力学系统的输出方程为

X˙m=fmXm,um (1)
X˙t=ftXt,ut (2)
Y=hXm,Xt (3)

式中:X表示导弹或目标系统状态向量;u表示导弹或目标系统控制向量;Y表示弹目复合动力学系统输出向量;下标m与t分别表示导弹与目标,且XmRnmumRmmXtRntutRmtYRp

将式(1~3)系统方程离散化后,得

Xm,k+1=Fm,kXm,k,um,k (4)
Xt,k+1=Ft,kXt,k,ut,k (5)
Yk=hXm,k,Xt,k (6)

式中:Xm, kXt, kYk分别为第k个离散时刻的导弹状态向量、目标状态向量、复合动力学系统输出向量,记N为离散点总数,其对应k可取值为1,2,,Num, kut, k分别为第k个离散时刻的导弹控制向量、目标控制向量,其对应k可取值为1,2,,N-1

假定弹目博弈交战场景中,导弹和目标飞行器均在前M个离散时刻进行决策,导弹的目标在减小弹目复合动力学系统输出大小的同时减小自身控制量的大小,而目标飞行器的目标则是在增大弹目复合动力学系统输出大小的同时减小自身控制量的大小。则弹目双方的性能指标函数定义为

Jm=12UmTRmUm+12YNTQmYN (7)
Jt=12k=1Mut,kTRt,kut,k-12YNTQtYN (8)

式中:RmRMmm×MmmRt,kRmt×mtQmRp×pQtRp×p均为正定矩阵;Um表示导弹在M个离散时刻的所有控制向量的复合向量,定义为Um=ut,1T,ut,2T,,ut,MTT

1.1.2 Stackelberg主从博弈框架

在完成指标函数定义后,引入Stackelberg主从博弈框架用于进一步定义博弈问题。假设飞行器的控制向量不会在短时间内发生突变,则在基于Stackelberg博弈框架进行博弈建模时,可认为在博弈过程中,由目标飞行器首先进行决策,随后导弹观测到目标飞行器控制向量;在博弈均衡点求解过程中将目标飞行器第1个离散时刻的控制向量ut,1指定为通过历史数据解算得到的目标飞行器控制向量观测值u^t,并基于此进行均衡决策的求解。考虑导弹控制向量服从若干非线性不等式约束的情形,可得到待求解博弈问题P1为

P1:minUmJm=12UmTRmUm+12YNTQmYNminUtJt=12UtTRtUt-12YNTQtYNs.t.gUm0

式中:Ut=ut,2T,ut,3T,,ut,MTTRt=diag(Rt,2, Rt,3,,Rt,M)

至此,本文给出了一种基于Stackelberg博弈架构进行多步博弈的方案,即在跟随者的决策过程中,仅认为领导者的第1步决策固定为观测值,后续决策仍作为变量,跟随者需要求解的问题由单步Stackelberg博弈得到的单边最优问题变为博弈两方的双边最优问题。

1.1.3 控制量迭代

按照基于MPSP的航天器轨道博弈方法的思路,可通过迭代方法求解问题P1,在每次迭代中更新UmUt,使之最终趋于均衡解。在第i次迭代时,弹目性能指标函数可定义为

Jmi=12Umi+ΔUmiTRmUmi+ΔUmi+12YNi+ΔYNiTQmYNi+ΔYNi (9)
Jti=12Uti+ΔUtiTRtUti+ΔUti-12YNi+ΔYNiTQtYNi+ΔYNi (10)

式中ΔYNi可取对ΔUmiΔUti泰勒展开的一次项,即

ΔYNi=BmiΔUmi+BtiΔUti

式中BmiBti分别为第i次迭代时YNiUmiUti的Jacobi矩阵,也可称为导弹和目标飞行器的敏感矩阵。

仿照MPSP方法的思路,矩阵Bmi的计算可通过迭代的方式进行,即

Bm,N-10i=YNiXm,Ni=hXmXm=Xm,NiXt=Xt,Ni (11)
Bm,k-10i=Bm,k0iFm,kiXm,ki (12)
Bm,ki=Bm,k0iFm,kium,ki (13)
Bmi=Bm,1iBm,2iBm,Mi (14)

式(12)中,k可取值为2,3,,N-1式(13)中,k可取值为1,2,,M

矩阵Bti的计算基本同理,此处不再赘述。

为了降低每次迭代需要求解的问题复杂度,本文对问题P1中的非线性不等式约束进行了处理。在第i次迭代时,可将P1中的非线性不等式约束通过适当的方式松弛为线性不等式约束,则可得到第i次迭代需要求解的子问题

SP1:minΔUmiJmi=JmUi+JmYiminΔUtiJti=JtUi-JtYis.t.AiΔUmibi

式中

JmUi=12Umi+ΔUmiTRmUmi+ΔUmi
JmYi=12YNi+ΔYNiTQmYNi+ΔYNi
JtUi=12Uti+ΔUtiTRtUti+ΔUti
JtYi=12YNi+ΔYNiTQtYNi+ΔYNi

根据非线性约束的具体形式,实际的松弛方法也存在差异。本文考虑的非线性约束及松弛方法将在1.2.2小节详述。

通过合理配置RtQt,可使得JmiJti均为凸函数。容易证明此时问题SP1必然存在Stackelberg均衡。随后可引入有效集法对带有线性不等式约束的问题SP1进行求解。使用有效集法求解问题SP1的迭代公式将在1.1.4小节给出。

求解得到问题SP1的均衡解ΔUmi*ΔUti*后,对UmUt进行更新,作为Umi+1Uti+1,随后根据更新后的弹目控制量重新计算弹目状态,用于问题P1求解过程的下一次迭代。

重复上述步骤,直至UmiUti收敛至某一特定值,此时即可将UmiUti作为问题P1的均衡解Um*Ut*。至此,可认为MPSG方法的解收敛至问题P1的均衡解,求解结束。

关于问题P1求解的收敛性问题,需要指出,MPSG算法由MPSP算法延伸而来,而MPSP算法是一种基于迭代的数值优化算法,可从理论上证明其最优解的存在性与迭代收敛性,但量化分析其收敛速度的难度较大。此研究领域内有关算法收敛性的研究主要集中于收敛速度的提高方法,如Zhou

11提出的配点离散方法。本文主要给出一种基于Stackelberg博弈与模型预测方法的制导律设计方案,MPSG方法与配点离散等提速方法的结合将在后续研究中进行。

1.1.4 有效集迭代

仿照基于MPSP的航天器轨道博弈方法研

16思路,问题SP1中,若对任意ΔUmiΔUti,存在ΔUti*与映射ΔUmi*ΔUti满足Jmi(ΔUmi*ΔUti, ΔUti)JmiΔUmi,ΔUtiJti(ΔUmi*(ΔUti*),ΔUti*) JtiΔUmi*ΔUti,ΔUti,则称ΔUmi*ΔUti*,ΔUti*构成问题SP1的Stackelberg均衡。下面给出在有效集法框架下的Stackelberg均衡求解迭代公式。

使用有效集法求解问题SP1也需要通过多次迭代进行。设在使用有效集法求解问题SP1的第j步迭代时,活动约束集为Sj,由活动约束集确定的活动约束为

ASjiΔUmi,j=bSji (15)

则可基于Jm构造拉格朗日函数

Li,jΔUmi,j,ΔUti,j,λj=12Umi+ΔUmi,jTRmUmi+ΔUmi,j+12YNi+ΔYNi,jTQmYNi+ΔYNi,j+λjTASjiΔUmi,j-bSji (16)

式中

ΔYNi,j=BmiΔUmi,j+BtiΔUti,j (17)

式(16)求偏导可得

Li,jΔUmi,j=Umi+ΔUmi,jTRm+YNi+ΔYNi,jTQmBmi+λjTASji (18)

按照有效集法,在求解问题SP1的第j步迭代时,Li,jΔUmi,j的偏导数应为零,同时联立式(151718),可得

Rm+BmiTQmBmiASjiTASjiOΔUmi,jλj=-RmUmi+BmiTQmYNi+BtiΔUti,jbSji

容易证明,矩阵ASji行满秩时,可对上述线性方程组的系数矩阵求逆,而在有效集法迭代过程中,这一条件容易满足。由分块矩阵求逆公式可得

ΔUmi,j=-P:Mmmi,jRmUmi-P:Mmmi,jBmiTQmYNi+BtiΔUti,j+PMmm+1:i,jTbSji (19)
λj=-PMmm+1:i,jRmUmi-PMmm+1:i,jBmiTQmYNi+BtiΔUti,j-ASjiHmi-1ASjiT-1bSji (20)

式中

P:Mmmi,j=Hmi-1-Hmi-1ASjiTPMmm+1:i,j
PMmm+1:i,j=ASjiHmi-1ASjiT-1ASjiHmi-1
Hmi=Rm+BmiTQmBmi

定义函数ΔUmi,j*ΔUti,j为从ΔUti,j到满足式(19)ΔUmi,j的映射,则在求解问题SP1的第j步迭代时,ΔUti,j若要取得均衡解,应有

Jti,jΔUmi,j=ΔUmi,j*ΔUti,jΔUti,jT=0 (21)

由问题SP1中Jt表达式以及式(171921)可得

RtUti+ΔUti,j*-BmiΔUmi,j*ΔUti,j+BtiTQtYNi-BmiΔUmi,j*ΔUti,j+BtiTQtΔYNi,j*=0 (22)
ΔUmi,j*ΔUti,j=-P:Mmmi,jBmiTQmBti (23)

式中ΔYNi,j*=BmiΔUmi,j*ΔUti,j*+BtiΔUti,j*

联立式(192223),得

ΔUti,j*=Hti,j-1Bm*ti,jTQtYNi+Hti,j-1Bm*ti,jTQtBmiΔUm0i,j* (24)

式中

Bm*ti,j=BmiΔUmi,j*ΔUti,j+Bti
Hti,j=Rt-Bm*ti,jTQtBm*ti,j
ΔUm0i,j*=-P:Mmmi,jRmUmi+BmiTQmYNi+PMmm+1:i,jTbSji

式(24)可得到ΔUti,j*,代入式(1920)即可得到求解问题SP1第j步迭代的ΔUmi,j*ΔUti,j*λj*。使用有效集法,根据λj*判断是否存在过活动约束,根据ΔUmi,j*ΔUti,j*判断是否需要增加活动约束,相应修改活动约束集,具体方法此处不再赘述。当活动约束集不需要发生改变时,迭代收敛,则可将此时的ΔUmi,j*ΔUti,j*ΔUti,j*作为问题SP1的均衡解ΔUmi*ΔUti*

关于问题SP1求解的收敛性问题,需要指出,使用有效集法求解问题SP1的方法属于使用有效集法求解线性不等式约束条件下二次规划问题的延伸,其最优解存在性与收敛性可在理论层面得到证明,而收敛速度同样难以量化分析。但可以确定,若问题SP1的均衡解不在任何不等式约束的边界处,问题SP1的迭代仅需要一步即可完成。配点离散方法同样可提高问题SP1的算法收敛速度,将类似方法应用于问题SP1的求解以提高算法收敛速度的方案也将在后续研究中给出。

1.2 制导律设计

1.2.1 导弹动力学方程

将上述MPSG方法应用于博弈制导时,可认为导弹与目标动力学方程均满足下面给出的无推力飞行器三自由度动力学方程形式。在导弹动力学方程中,假设加速度指令的执行存在一阶延迟,并基于导弹自身三自由度动力学模型参数给出导弹所受阻力的表达式

X˙m=VmcosθmcosψmVmsinθm-Vmcosθmsinψm-Dmmm-gsinθmaym-gcosθmVm-azmVmcosθmaymc-aymτmazmc-azmτm (25)
Dm=12Cx0mρmSmVm2+2Kmmm2aym2+azm2ρmSmVm2

其中导弹状态向量与控制向量定义为

Xm=xm,ym,zm,Vm,θm,ψm,aym,azmT
um=aymc,azmcT

式中:x,y,zT表示北天东坐标系下的位置坐标;V表示速度大小;θψ分别表示弹道倾角与弹道偏角;ayaz分别表示自身加速度在自身弹道坐标系下y轴与z轴方向的分量;g为重力加速度大小;Cx0表示零升阻力系数;ρ表示所处位置大气密度;S表示特征面积;K表示诱导阻力因子;m表示质量;下标c表示指令值。而在目标动力学方程中,为了简化问题,此处忽略目标飞行器所受到的诱导阻力,并忽略目标飞行器执行加速度指令的延迟,则

X˙t=VtcosθtcosψtVtsinθt-Vtcosθtsinψt-12CxtρtVt2-gsinθtayt-gcosθtVt-aztVtcosθt (26)

式中

Xt=xt,yt,zt,Vt,θt,ψtT
ut=ayt,aztT

另外,Cxt可根据目标历史状态估计得到,并在应用MPSG方法求解均衡决策时假定其为常值。受篇幅限制,此处不再详细介绍估计方法。

考虑到实际弹目博弈交战场景需求,可将弹目复合动力学系统的输出方程定义为弹目相对位置矢量

Y=hXm,Xt=xt-xmyt-ymzt-zm (27)

MPSG方法的应用可基于上述系统方程进行。

1.2.2 过载约束处理

此处给出本文在求解弹目追逃博弈问题时所考虑的非线性不等式约束,并给出松弛线性化方法,从而降低每次迭代待求解问题的复杂度。

在MPSG算法中,指定导弹每个时刻的过载指令加速度大小应当小于给定值am, max,则问题P1中的非线性不等式约束可表示为

12um,kTum,k12am, max2

而在求解问题P1的第i次迭代过程中,可将其松弛为以下不等式约束

Δaym,kam,max-aym,ki (28)
-Δaym,kam,max+aym,ki (29)
Δazm,kam,max-azm,ki (30)
-Δazm,kam,max+azm,ki (31)
2um,kiTΔum,kam,max2-um,kiTum,ki (32)

式中k可取值为1,2,,M。而在完成问题SP1的求解,得到ΔUmi*ΔUti*后,可更新弹目控制向量

um,ki+1=umo,ki+1umo,ki+1am,maxam,maxumo,ki+1umo,ki+1其他 (33)
Uti+1=Umi+ΔUmi* (34)

式中k可取值为1,2,,M,且umo,ki+1=um, ki+Δum, ki*

随着迭代的进行,可以认为博弈问题在上述松弛后的可行域的均衡解将逐步趋近于原有可行域的均衡解。

1.2.3 算法流程

考虑算法的实际实现,基于MPSG方法的制导算法可分为两部分。其中一部分算法需要在每个制导周期记录目标飞行器的状态数据及对应的采样时刻,并依此估计目标飞行器的控制向量u^t及目标飞行器预测模型参数Cxt;而另一部分算法则在每个制导周期根据弹目飞行器状态数据以及目标飞行器控制向量与模型参数估计值给出弹目均衡决策Um*Ut*。估计目标飞行器控制向量与模型参数部分的算法较容易实现,也并非本文的重点,此处不再详细介绍。本文主要给出另一部分算法,即均衡决策求解算法的实现过程。

制导算法在每个制导周期的最开始运行,需要获取当前弹目状态与目标飞行器当前控制估计值u^t,随后基于算法内置的弹目动力学模型,令导弹采用比例导引制导律,决策生成过程中根据导弹过载上限对生成的控制向量进行限幅;目标飞行器在第1个离散时刻的控制向量指定为u^t,而从第2个离散时刻开始,azt与第1个离散时刻一致,ayt置零,直至第M个离散时刻。此后直至第N个离散时刻,弹目控制均置为零,将所得弹目控制作为迭代的初始解Um1Ut1,随后开始迭代。而在第i次迭代中,首先进行敏感矩阵计算,随后基于Umi,按照1.2.2小节给出的方式进行过载约束松弛处理,得到松弛约束并构造问题SP1,并由式(192024)等,基于1.2.1小节的方法使用有效集法求解问题SP1,得到ΔUmi*ΔUti*,并按照1.2.2小节给出的方式进行控制量更新,得到Umi+1Uti+1,同时相应更新弹目预测状态序列,则一次迭代结束。当迭代导致弹目终端时刻状态向量Xm,NXt,N趋于稳定时,可认为迭代收敛,并将所得UmUt作为算法所得的弹目均衡决策Um*Ut*,算法运行结束。

均衡解求解算法如下所示。

算法1   博弈均衡点求解流程

输入:弹目状态向量XmXt、目标飞行器决策估计值u^t、目标预测模型参数Cxt及其他常参数

输出:弹目均衡决策Um*Ut*

(1) 基于初始弹目状态与指定初始决策方式获取初始决策Um1Ut1及对应状态序列;

(2) 由式(27)得到YN1i:=1

(3) While true

(4)   由式(11~14)等计算敏感矩阵BmiBti

(5)   根据式(28~32)构造线性化增量博弈问题SP1的不等式约束AiΔUmibi

(6)   根据1.1小节使用有效集法求解线性化增量博弈问题SP1得到ΔUmi*ΔUti*

(7)   由式(3334)进行决策更新,并更新弹目状态序列;

(8)   If Xm,NXt,N在更新弹目决策前后变化趋于零

(9)     Um*:=Umi+1Ut*:=Uti+1,return;

(10)   End

(11)   i:=i+1

(12) End

算法2   线性化增量博弈问题求解算法流程

输入:弹目控制向量UmiUti、敏感矩阵BmiBti、终端输出向量YNi、不等式约束AiΔUmibi及其他常参数

输出:弹目均衡控制量增量ΔUmi*ΔUti*

(1) S1:=j:=1

(2) While true

(3)   将Sj中的不等式约束取等号,构造活动约束ASjiΔUmi=bSji

(4)   由式(2324)计算ΔUti,j*

(5)   将ΔUti,j=ΔUti,j*代入式(20)得到λj

(6)   If λj中存在负元素

(7)     将λj中负元素对应的约束从Sj中去除,得到Sj+1,并跳至第16行;

(8)   End

(9)   由式(19)计算ΔUmi,j

(10)   If ΔUmi,j不满足不等式约束AiΔUmibi

(11)     在0,1范围内找到能够使αAiΔUmibi刚好成立的最大α值;

(12)     将不等式约束中随α变化刚好成立的约束加入Sj,得到Sj+1

(13)   Else

(14)     ΔUmi*:=ΔUmi,jΔUti*:=ΔUti,j,return;

(15)   End

(16)   j:=j+1

(17) End

2 数值仿真

本文在两个典型场景中基于MATLAB R2024b进行拦截数值仿真。其中,场景1的目标飞行器与拦截弹一同使用MPSG方法进行基于博弈的机动;场景2的目标飞行器机动为预先设计的螺旋机动。

另外,虽然在1.2小节中对目标动力学方程进行了简化处理,但在本节的数值仿真中,目标飞行器与导弹一并使用考虑诱导阻力与一阶执行机构延迟的三自由度飞行器动力学模型。

本节随后将分别给出两个场景的仿真结果。

2.1 强博弈目标拦截场景

此场景中,目标采用MPSG方法计算机动指令以回避导弹拦截。场景想定参数如表1所示。

表 1  强博弈目标场景设定
Table 1  Scenario setup of the intensive game competitive target
参数导弹目标
初始位置/km [0, 5, 0] [5, 7, -0.5]
初始速度/(m·s-1 [900, 500, 100] [-300, 0, 0]

指令响应延迟

时间常数/s

0.3 0.1
过载上限/g 24 12

分别使用本文MPSG方法与比例导引(Proportion navigation, PN)方法拦截目标,得到各自脱靶量、拦截时刻、平均计算时间、拦截轨迹、过载曲线,如表2及图1~3所示。

表 2  强博弈目标仿真结果
Table 2  Simulation results of the intensive game competitive target
参数MPSGPN
脱靶量/m 5.385 3 14.693 8
终端时刻/s 4.381 6 4.374 1
平均计算时间/ms 65.603 8 1.134 8

图1  强博弈目标拦截轨迹

Fig.1  Interception trajectory of the intensive game competitive target

图2  强博弈目标总过载曲线

Fig.2  Total overload curves of the intensive game competitive target

图3  强博弈目标过载分量曲线

Fig.3  Overload component curves of the intensive game competitive target

上述结果表明,上述场景中,针对强博弈机动目标,本文MPSG方法拦截精度优于传统PN方法。由图2可知,面对强博弈目标在拦截过程最终1 s内突然出现的高机动,使用PN方法的导弹不断增大过载,出现过载饱和,最终导致脱靶量较大;而使用MPSG方法的导弹由于考虑了过载上限与响应延迟,未出现过载饱和现象,最终得到较小的脱靶量。

导弹使用MPSG方法拦截目标时,每次调用MPSG算法求解问题P1的迭代次数与计算用时、求解问题P1每次迭代求解问题SP1的平均迭代次数如图4~6所示。

图4  强博弈目标问题P1迭代次数

Fig.4  Iteration count for P1 of the intensive game competitive target

图5  强博弈目标计算时间

Fig.5  Computation time of the intensive game competitive target

图6  强博弈目标问题SP1迭代次数

Fig.6  Iteration count for SP1 of the intensive game competitive target

上述结果表明,绝大多数情况下,问题P1求解可通过少于4次迭代完成,问题SP1求解仅需进行1次迭代。由图26可知,问题SP1求解迭代次数较多时,强博弈目标出现高机动,PN方法已出现饱和,可知MPSG方法在问题SP1的求解过程中为处理过载饱和约束进行了一定次数的迭代,最终使得均衡解位于过载约束可行域内。图5则说明绝大多数情况下MPSG算法可在100 ms以内完成,若结合配点离散方法,或使用C/C++等编程语言实现算法,可用更短的计算时间完成算法计算过程。

2.2 非智能目标拦截场景

此场景中,目标进行过载大小约8g,周期约3 s的螺旋机动以回避导弹拦截。场景想定参数如表3所示。

表 3  非智能目标场景设定
Table 3  Scenario setup of the non⁃intelligent target
参数导弹目标
初始位置/km [0, 5, 0] [5, 7, -0.5]
初始速度/(m·s-1 [900, 500, 100] [-300, 0, 0]

指令响应延迟

时间常数/s

0.3 0.1
过载上限/g 24 N/A

分别使用本文MPSG方法与PN方法拦截目标,得到各自脱靶量、拦截时刻、平均计算时间、拦截轨迹、过载曲线,如表4及图7~9所示。

表 4  非智能目标仿真结果
Table 4  Simulation results of the non⁃intelligent target
参数MPSGPN
脱靶量/m 4.203 1 24.740 7
终端时刻/s 4.479 8 4.475 3
平均计算时间/ms 70.154 3 1.112 9

图7  非智能目标拦截轨迹

Fig.7  Interception trajectory of the non-intelligent target

图8  非智能目标总过载曲线

Fig.8  Total overload curves of the non-intelligent target

图9  非智能目标过载分量曲线

Fig.9  Overload component curves of the non-intelligent target

上述结果表明,上述场景中,针对持续螺旋机动目标,本文MPSG方法拦截精度优于传统PN方法。由图8可知,面对目标在拦截过程最终约1.5 s的持续高机动,使用PN方法的导弹过载不断增大,出现过载饱和,最终导致脱靶量较大;而使用MPSG方法的导弹由于考虑了过载上限与响应延迟,未出现过载饱和现象,最终得到较小的脱靶量。

导弹使用MPSG方法拦截目标时,每次调用MPSG算法求解问题P1的迭代次数与计算用时、求解问题P1每次迭代求解问题SP1的平均迭代次数如图10~12所示。

图10  非智能目标问题P1迭代次数

Fig.10  Iteration count for P1 of the non-intelligent target

图11  非智能目标计算时间

Fig.11  Computation time of the non-intelligent target

图12  非智能目标问题SP1迭代次数

Fig.12  Iteration count for SP1 of the non-intelligent target

上述结果表明,绝大多数情况下,问题P1求解可通过少于4次迭代完成,问题SP1求解仅需进行1次迭代。由图812可知,问题SP1求解迭代次数较多时,比例导引方法出现过载饱和,可知MPSG方法在问题SP1的求解过程中为处理过载饱和约束进行了一定次数的迭代,最终使得均衡解位于过载约束可行域内,与2.1小节中场景1的情况类似。图11则说明绝大多数情况下MPSG算法可在120 ms以内完成,若采用配点离散方法与C/C++编程语言同样可以缩短计算耗时。

3 结  论

本文提出了一种基于MPSG的导弹末制导律,旨在应对未来战争中高机动强博弈目标带来的挑战。通过构建导弹与目标的非线性动力学模型,并迭代更新多个离散时刻的控制量,实现了双边最优制导。数值仿真结果证实,MPSG制导律在不同拦截场景下均表现出优越的拦截性能,显著提升了导弹的拦截精度与成功率。本文的研究结果为:

(1)针对高机动强博弈目标,所提出的博弈制导律能够使拦截弹与目标的脱靶量达到博弈均衡,拦截弹能够以较小的脱靶量拦截目标,同时保证能量消耗较小;

(2)针对非智能目标,所提出的制导律仍然具有优于传统制导律的拦截性能,表明制导律具有较广的适用范围;

(3)在前人已有的将Stackelberg博弈与MPSP结合的研究基础上,给出了约束处理与多步决策方法;

(4)给出了导弹法向加速度大小上限的非线性约束的线性松弛化方案,从而大大降低了每次迭代需要求解的问题的难度与复杂度,使计算复杂度明显降低。

参考文献

1

李炯李万礼张锦林.反高速强机动目标拦截弹制导与控制关键技术浅析[J/OL].现代防御技术20241-14. [2024-10-22].http://kns.cnki.net/kcms/detail/11.3019.TJ.20241018.1350.011.html. [百度学术] 

LI JiongLI WanliZHANG Jinlinet al. An Analysis of the key technologies for guidance and control of anti-high speed and strong mobility target interceptor[J/OL]. Modern Defence Technology20241-14. [2024-10-22]. http://kns.cnki.net/kcms/detail/11.3019.TJ.20241018.1350.011.html. [百度学术] 

2

钱杏芳. 导弹飞行力学[M]. 北京北京理工大学出版社2000. [百度学术] 

QIAN Xingfang. Missile flight mechanics[M]. BeijingBeijing Insititute of Technology Press2000. [百度学术] 

3

BABU K RSARMA I GSWAMY K N. Switched bias proportional navigation for homing guidance against highly maneuvering targets[J]. Journal of Guidance, Control, and Dynamics1994176): 1357-1363. [百度学术] 

4

MEHRANDEZH MSELA N MFENTON R Get al. Robotic interception of moving objects using an augmented ideal proportional navigation guidance technique[J]. IEEE Transactions on Systems, Man, and Cybernetics—Part A: Systems and Humans2000303): 238-250. [百度学术] 

5

FARUQI F A. Differential game theory with applications to missiles and autonomous systems guidance[M]. Hoboken, USAJohn Wiley & Sons2017. [百度学术] 

6

王鹏何智川李军智. 拦截机动目标的固定时间事件触发协同制导律[J]. 北京理工大学学报20244410): 1040-1050. [百度学术] 

WANG PengHE ZhichuanLI Junzhiet al. Event-triggered fixed-time cooperative guidance law against maneuvering target[J]. Transactions of Beijing Institute of Technology20244410): 1040-1050. [百度学术] 

7

张晨欣王宁宇王小刚. 空空导弹反强机动目标时间约束滑模制导律[J]. 宇航学报20234410): 1544-1554. [百度学术] 

ZHANG ChenxinWANG NingyuWANG Xiaogang. Time-constrained sliding mode guidance law of air-to-air missile against strong maneuvering target[J]. Journal of Astronautics20234410): 1544-1554. [百度学术] 

8

RADHAKANT PMANGAL K. Model predictive static programming: A computationally efficient technique for suboptimal control design[J]. International Journal of Innovative Computing Information and Control200952): 399-411. [百度学术] 

9

ZHOU CYAN X DTANG S. Generalized quasi-spectral model predictive static programming method using Gaussian quadrature collocation[J]. Aerospace Science and Technology2020106106134. [百度学术] 

10

ZHOU CYAN X DBAN H Het al. Generalized-Newton-iteration-based MPSP method for terminal constrained guidance[J]. IEEE Transactions on Aerospace and Electronic Systems2023596): 9438-9450. [百度学术] 

11

ZHOU CHE LYAN X Det al. Active-set pseudospectral model predictive static programming for midcourse guidance[J]. Aerospace Science and Technology2023134108137. [百度学术] 

12

MONDAL SPADHI R. Constrained quasi-spectral MPSP with application to high-precision missile guidance with path constraints[J]. Journal of Dynamic Systems, Measurement, and Control20211433): 031001. [百度学术] 

13

周聪. 临近空间机动目标拦截预测中制导方法[D]. 西安西北工业大学2023. [百度学术] 

14

ZHANG TZHU Y JMA D Yet al. Toward rapid and optimal strategy for swarm conflict: A computational game approach[J]. IEEE Transactions on Aerospace and Electronic Systems2024603): 3108-3120. [百度学术] 

15

LIU Y CZHANG Y HJIANG Jet al. Multiple-to-one orbital pursuit: A computational game strategy[J]. IEEE Transactions on Aerospace and Electronic Systems202499): 1-12. [百度学术] 

16

LIU Y CLI C YJIANG Jet al. A model predictive Stackelberg solution to orbital pursuit-evasion game[J]. Chinese Journal of Aeronautics2025382): 103198. [百度学术] 

17

PAWLICK JZHU Q Y. Game theory for cyber deception: From theory to applications[M]. Cham, SwitzerlandBirkhäuser Cham. [百度学术] 

您是第位访问者
网站版权 © 南京航空航天大学学报
技术支持:北京勤云科技发展有限公司
请使用 Firefox、Chrome、IE10、IE11、360极速模式、搜狗极速模式、QQ极速模式等浏览器,其他浏览器不建议使用!