网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

输入受限乘波体飞行器的最优跟踪控制方法  PDF

  • 齐强 1
  • 卜祥伟 2
  • 姜宝续 1
  • 唐骁 1
  • 钟伟杰 1
1. 空军工程大学研究生院,西安 710051; 2. 空军工程大学防空反导学院,西安 710051

中图分类号: TP273

最近更新:2021-10-28

DOI:10.16356/j.1005-2615.2021.S.006

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

针对存在输入受限的乘波体飞行器最优跟踪问题,基于反演控制设计了最优跟踪控制器。将控制分为稳态跟踪控制和瞬态最优控制两部分。首先基于反演控制框架,引入有限时间收敛跟踪器对虚拟控制律进行估计,避免了普遍存在的“微分项膨胀”问题。其次,考虑系统中存在不确定项,设计了非线性干扰观测器对不确定项进行估计,确保控制器的鲁棒性。同时,充分考虑输入受限情况,基于辅助误差补偿策略对控制输入进行修正。然后,为了实现最优控制,基于自适应动态规划设计瞬态最优控制器。最终通过数字仿真,验证所设计控制方法的有效性。

对于存在高不确定性、强非线性以及多约束与快时变的复杂跟踪系统,其控制系统的设计存在诸多困难。乘波体飞行器(Waverider vehicle, WV)就是其中的代表。

针对WV的飞行控制问题,国内外诸多学者提供了许多行之有效的方

1。如基于非线性干扰观测器的Backstepping方2,针对WV快时变特性的预设性能控制方3,考虑WV迎角受限的自学习控制方4,以及利用神经网络的智能控制方5。但是,缺少对WV的最优跟踪问题的研究。

近些年,自适应动态规划(Adaptive dynamic programming,ADP)作为一种针对复杂系统的最优控制方法受到人们普遍关注。通过与Backstepping有效结合,ADP可以促使形成对复杂系统的近似最优控制。文献[

6]利用ADP实现了对WV的最优控制,但是没有考虑模型中存在不确定项问题。文献[7]将控制分为两部分,分别处理稳态跟踪问题和最优控制问题,在最优控制器的设计中采用执行‑评价网的双网络结构进行设计。文献[8]同样将控制分为2部分,但相较于前者,采用了更加简单的单网络结8。很明显,这些文献都没有考虑输入受限情形下的最优控制问题。

基于以上分析,本文针对输入受限情形,基于反演控制设计了最优跟踪控制器。将控制分为稳态控制和最优控制两部分,分别处理稳态跟踪和最优控制问题。主要有以下优势:(1)相较于文献[

7]中的ADP方法,本文采用了文献[9]中的单网络模糊评价器(Fuzzy critic estimator, FCE),大幅降低了神经网络的个数;(2)相较于文献[8],本文解决了输入受限情形下WV的近似最优控制问题。

1 乘波体飞行器模型及问题分析

1.1 乘波体飞行器运动模型

本文采用Parker

10在Bolender与Doman11研究基础上建立的WV纵向运动参数拟合模型

V˙=cos(θ-γ)mT-Dm-gsinγ (1)
h˙=Vsinγ (2)
γ˙=LVm+sin(θ-γ)VmT-gVcosγ (3)
θ˙=Q (4)
Q˙=MIyy+ψ˜1Iyyη¨1+ψ˜2Iyyη¨2 (5)
k1η¨1=N1-ω12η1-2ζ1ω1η˙1-ψ˜1M+ψ˜2η¨2Iyy (6)
k2η¨2=N2-ω22η2-2ζ2ω2η˙2-ψ˜2M+ψ˜1η¨1Iyy (7)

式中包括5个刚体状态(速度V,高度h,航迹角γ,俯仰角θ,俯仰角速度Q)以及2个弹性状态(η1η2);TDLM分别代表WV的推力、阻力、升力与俯仰力矩,N1N2为广义弹性力,并且它们的参数拟合形式如下

TCTα3α3+CTα2α2+CTαα+CT0
Lq¯SCLαα+q¯SCLδeδe+q¯SCL0
DCDα2α2q¯S+CDααq¯S+CDδe2δe2q¯S+CDδeδeq¯S+CD0q¯S
MzTT+q¯Sc¯CM,αα2α2+q¯Sc¯CM,ααα+q¯Sc¯CM,α0+q¯Sc¯ceδe
N1=N1α2α2+N1αα+N10
N2=N2α2α2+N2αα+N2δeδe+N20
q¯=12ρ¯V2,ρ¯=ρ¯0exp-h-h0hs

式中

CTα3=β1(h,q¯)Φ+β2(h,q¯)CTα2=β3(h,q¯)Φ+β4(h,q¯)
CTα=β5(h,q¯)Φ+β6(h,q¯)CT0=β7(h,q¯)Φ+β8(h,q¯)

上述模型的具体几何参数与气动参数见于文献[

10]。

1.2 模型转换

对于WV,可以将其控制系统分为速度子系统和高度子系统两部分,并且转换为以下形

12

V˙=fV+gVΦa+Φ*+dV (8)

式中

fV=cosαm[β2(h,q¯)α3+β4(h,q¯)α2+β6(h,q¯)α+           β8(h,q¯)]-q¯Sm(CDα2α2+CDαα+CD0)-gsinγgV=cosαm[β1(h,q¯)α3+β3(h,q¯)α2+β5(h,q¯)α+           β7(h,q¯)]0dV=-q¯Sm[(CDδe2+ΔCDδe2)δe2+(CDδe+ΔCDδe)δe]+           ΔfV+ΔgV+dV0式中:Φa为稳态控制输入,Φ*为瞬态控制输入,dV为总不确定项。

同理,高度子系统可以转换为以下形式

γ˙=fγ+gγθ+dγθ˙=QQ˙=fQ+gQδe+dQ (9)

式中

gγ=q¯SCLαmV0
gQ=q¯Sc¯ceIyy0
fγ=q¯S(CL0-CLαγ)+TsinαmV-gcosγ
fQ=zTT+q¯Sc¯CM,ααIyy
dγ=q¯S(CLδe+ΔCLδe)δeIyy+Δgγ+Δfγ+dγ0
dQ=ψ˜1η¨1+ψ˜2η¨2Iyy+ΔgQ+ΔfQ+dQ0

式中 dγdQ为总不确定项。参考相关文献[

12]的做法,将弹性状态看做总不确定项 dγdQ的一部分。

控制的目的是确定合适的控制输入Φδe,使WV稳定跟踪参考输入。在实际飞行中,为使Scramjet正常工作,一般取Φ0.05, 1.5;受到偏转角度的物理限制,通常δe-20°, 20°。但是考虑到WV的飞行姿态限制,尽量保证飞行的安全性,Φδe的实际可执行范围还要更小。本文将控制输入受限问题定义为

Φ=Φmax     Φc>ΦmaxΦc        ΦminΦcΦmaxΦmin     Φc<Φmin (10)
δe=δemax     δec>δemaxδec        δeminδecδemaxδemin     δec<δemin (11)

1.3 单网络估计器

对于系统

x˙=f(x)+g(x)u (12)

式中:x为状态变量,fxRngxRn×puRpfx为Lipschitz连续的非线性函数,且在ΩRn上,Ω包含原点。

引理1   对于以上系统,可以通过FCE去逼近函数值

V(X)=βTtanh(ΦX)+ε (13)

式中X=[x1, x2, , xn]TRn为模糊系统的输入向量;β=[β1, β2, , βn]TRn为权系数向量,tanh(ΦX)=[tanh(ϕ1x1),,tanh(ϕnxn)]T,并且Φ=diag{ϕi},i=1,,nε为估计误

9

2 控制器设计及稳定性分析

2.1 速度稳态控制器设计

将速度误差定义为

zV=V-Vref-κV (14)

式中κV为辅助系统,用来处理输入受限问题,且

κ˙V=-ωVκVκV+δV+gV(Φ-Φc) (15)

式中ωVδV为待设计参数。

设计稳态控制输入Φa

Φa=gV-1-kV1zV-kV20tzVdτ-fV-d̂V+V˙ref (16)

式中:kV1kV2R+为待设计参数;d̂VdV的估计值,并且由以下NDO得到

V̂˙=fV+gVΦ+d̂Vd̂˙V=BV2-aV2d̂V/BVd̂V/BV+dVd-aV1V̂-VV̂-V+dVd (17)

式中:BVaV1aV2dVdR+为待设计参数,V̂d̂V分别为VdV的估计值。由文献[

13]可知,如果选择合适的参数,则存在有界常数d¯VR+使得d˜Vd¯V

d˜V=d̂V-dV (18)

式(14)求微分,并把式(9)式(16)代入得

z˙V=-kV1zV-kV20tzVdτ-d˜V (19)

选取Lyapunov函数

WV1=zV22+kV220tzVdτ2 (20)

式(20)求一阶导数后代入式(19)

W˙V1=-kV1zV2-zVd˜V+zVgVΦ* (21)

2.2 高度稳态控制器设计

步骤1   将航迹角跟踪误差定义为

zγ=γ-γd (22)

式(22)求导,并将式(9)代入得到

z˙γ=fγ+gγ(zθ+θd)+dγ-γ˙d (23)

式中θd=θda+θd*

虚拟控制律θ¯da

θ¯da=gγ-1-kγ1zγ-kγ20tzγdτ-fγ-d̂γ+γ˙d (24)

式中:kγ1kγ2R+为待设计参数;d̂γdγ的估计值。

步骤2   俯仰角跟踪误差定义为

zθ=θ-θd (25)

式(25)求导,并将式(9)代入得到

z˙θ=zQ+Qd-θ˙d (26)

式中Qd=Qda+Qd*

虚拟控制律Q¯da

Q¯da=-kθ1zθ-kθ20tzθdτ-gγzγ+θ˙d (27)

式中kθ1kθ2R+为待设计参数。

步骤3   俯仰角速度跟踪误差定义为

zQ=Q-Qd-κQ (28)

式中κQ为处理δe=δea+δe*输入受限问题的辅助系统,且

κ˙Q=-ωQκQκQ+δQ+gQ(δe-δec) (29)

式中ωQδQ为待设计参数。

式(29)求时间的一阶导数,并代入式(14)

z˙Q=fQ+gQδe+dQ-Q˙d-κ˙Q (30)

式中δe=δea+δe*

稳态控制输入δea被设计为

δea=gQ-1-kQ1zQ-kQ20tzQdτ-fQ-d̂Q-zθ+Q˙d (31)

式中:kQ1kQ2R+为待设计参数,d̂QdQ的估计值。

与速度子系统设计相似,采用相同的NDO对dγdQ进行估计

γ̂˙=fγ+gγθ+d̂γd̂˙γ=Bγ2-aγ2d̂γ/Bγd̂γ/Bγ+dγd-aγ1γ̂-γγ̂-γ+dγd (32)
Q̂˙=fQ+gQδea+d̂Qd̂˙Q=BQ2-aQ2d̂Q/BQd̂Q/BQ+dQd-aQ1Q̂-QQ̂-Q+dQd (33)

式中BγBQaγ1aγ2aQ1aQ2dγddQdR+为待设计参数。

定义NDO估计误差为

d˜γ=d̂γ-dγ,yγ=γ̂-γd˜Q=d̂Q-dQ,yQ=Q̂-Q (34)

利用FD对θ¯daQ¯da的一阶导数进行估计,分别为

θ˙da=ψθ1ψ˙θ1=B12-a12ψθ1/B1ψθ1/B1+d1d-a11θda-θ¯daθda-θ¯da+d1d (35)
Q˙da=ψQ1ψ˙Q1=B22-a22ψQ2/B2ψQ2/B2+d2d-a21Qda-Q¯daQda-Q¯da+d2d (36)

式中B1B2a11a12a21a22d1dd2dR+为待设计参数。

定义FD估计误差为

y1=θda-θ¯day2=Qda-Q¯da (37)

同理,由文献[

13]可知,通过选择适当的参数,存在有界常数d¯γy¯γd¯Qy¯Qy¯1y¯2R+,使得d˜γd¯γyγy¯γd˜Qd¯QyQy¯Qy1y¯1y2y¯2

选取以下Lyapunov函数

Wγ1=zγ22+kγ220tzγdτ2Wθ1=zθ22+kθ220tzθdτ2WQ1=zQ22+kQ220tzQdτ2 (38)

式(38)求时间的一阶导数,并分别将式(232426273031)代入可得

W˙γ1=-kγ1zγ2+zγgγy1+zγ(-d˜γ+gγ(zθ+θd*))W˙θ1-kθ1zθ2-zθgγzγ+zθy2+zθ(zQ+Qd*)W˙Q1-kQ1zQ2-zQzθ+zQ(-d˜Q+gQδed*) (39)

2.3 瞬态控制器设计

考虑如下系统

z˙j=gjuj      j=V,γ,θ,Q (40)

式中:uV=Φ*uγ=θd*uθ=Qd*uQ=δed*zj j=V,γ,θ,Q)为状态变量。

这一部分的设计目标是通过设计最优控制器uj,保证跟踪误差zj稳定,并保证以下性能指标最小

Vj=0(Qjzj2+Rjuj*2)dτ (41)

式中Qj0Rj0 j=V,γ,θ,Q)为待设计参数。

定义该系统的Hamiltonian函数为

H(zj,uj,Vj(zj))=Qjzj2+Rjuj2+(Vj(zj))Tgjuj (42)

式中Vj(zj)Vjzj的微分。

最优值函数VV*(zV)满足

0=minujΦ(Ω)H(zj,uj,Vj*(zj))=Qjzj2+Rjuj2+(Vj*(zj))Tgjuj (43)

则根据最优原理,最优控制的表达式为

uV*=-12RV-1gVTVV*(zV) (44)

式(43)直接求解HJB方程困难,因此选择FCE逼近函数值

Vj*(zj)=βjTtanh(ϕjzj)+εj (45)

式中:βj为权系数参数;ϕj为待设计参数;εj为估计误差,且εjε¯j。则Vj*(zj)关于zj的导数为

Vj*(zj)=Λj(zj)βj+εj (46)

式中:Λj(zj)=(ϕj-ϕjtanh2(ϕjzj))εj=εj/zj

β̂jβj的估计值,则Vj*(zj)Vj*(zj)的估计值为

V̂j(zj)=β̂jtanh(ϕjzj) (47)
V̂j(zj)=Λj(zj)β̂j (48)

进而得到近似的Hamiltonian函数

H(zj,ûj,V̂j(zj))=Qjzj2+Rjuj2+(Vj(zj))Tgjuj=ej (49)

设计β̂j的自适应律为

θ̂˙j=-bjσj(σjTθ̂j+Qjzj2+Rjuj2) (50)

式中:bj为自适应律的增益,σj=Λj(zj)gjujβ̂j

选取以下Laypunov函数

W=WV1+Wγ1+Wθ1+WQ1+Wj1+Wj2 (51)

式中:Wj1=j12bjtr(β˜jTβ˜j)Wj2=j(zj2+2ΓjVj)Γj>0为待设计参数。

Wj1求导得

W˙j1=j-β˜jTσjσjTβ˜j-2bj2bjβ˜jTσj12bjεj (52)

因为β˜jTσjσjTβ˜j>0,所以有qj>0使

qjβ˜j2β˜jTσjσjTβ˜j        qjσj2 (53)

所以

W˙j1j(-qj+bj2σj2)β˜j2+12bjε¯j (54)

W˙j2=j2zjTzj+2ΓjV˙jj[(2-2Γjλmin(Qj))zj2+(β¯j2-2Γjλmin(Rj))uj2] (55)

假设gjuj*cjzj,其中cj>0,则zjgjuj*12zj2+cj22zj。结合FD以及NDO估计误差,可得式(51)的微分

W˙h-(kV1-1)zV2-kγ1-gγ2-12zγ2-(kθ1-1)zθ2-(kQ1-1)zQ2+gγy¯122+y¯222+d¯V22-zγd˜γ-zQd˜Q+jcj22zj+j-qj+bj2σj2β˜j2+12bjε¯j+j[(2-2Γjλmin(Qj))zj2+(η¯j2-2Γjλmin(Rj))uj2] (56)

如果对于选择的kj1bjΓjθ˜jzj满足0<bj<2bjσj2Γj>max1λmin(Qj),η¯j22Γjλmin(Rj)且满足以下不等式

zV>maxd¯V22/(kV1-1),12bVε¯V2/2ΓVλmin(QV)-2

zγ>maxι/kγ1-gγ2-12,12bγε¯γ2/Ξγ

zθ>maxι/(kθ1-1),12bθε¯θ2/Ξθ

zQ>maxι/(kQ1-1),12bQε¯Q2/ΞQ

式中:ι=gγy¯122+d¯γ2+d¯Q22+y¯222Ξγ=2Γγλmin(Qγ)-2Ξθ=2Γθλmin(Qθ)-2ΞQ=2ΓQλmin(QQ)-2,且θ˜j>12bjε¯j2/qj-bj2σj成立,则W<0。跟踪误差zj权值估计误差β˜j j=V,γ,θ,Q)是半全局一直最终有界的。证毕。

3 仿真校验

WV的初始速度 V=2 500 m/s,初始高度h=27 000 m,速度阶跃幅度为700 m/s,高度阶跃为1 000 m。为了考量系统在输入受限情况下的效果,假设控制输入受到约束,取Φ0.05, 1δe-16.5°, 16.5°。同时,假设WV模型存在40%的摄动量。控制器的各项参数如表1所示,其中β̂j0(j=V,γ,θ,Q)为FCE的初始权值。

表 1 控制器各项参数
Table 1 Parameters of controllers
参数取值参数取值参数取值参数取值参数取值参数取值参数取值
kV1 1.1 kθ2 0.2 Bγ 0.1 dQd 0.5 a22 0.4 Rγ 0.2 QQ 1.5
kV2 0.8 kQ1 0.6 aγ1 0.5 B1 0.1 d2d 0.5 φγ 0.2 RQ 0.2
kh1 0.6 kQ2 0.1 aγ2 0.4 a11 0.5 QV 1.5 bγ 2×109 bQ 2×106
kh2 0.1 BV 0.1 dγd 0.5 a12 0.4 RV 0.2 Qθ 1.5 β̂V0 0.06
kγ1 0.3 aV1 0.5 BQ 0.1 d1d 0.5 φV 0.2 Rθ 0.2 β̂γ0 0.06
kγ2 0.2 aV2 0.4 aQ1 0.5 B2 0.1 bV 0.08 φθ 0.2 β̂θ0 0.06
kθ1 0.6 dVd 0.5 aQ2 0.4 a21 0.5 Qγ 1.5 bθ 5×106 β̂Q0 -0.06

由图1~8可知,在系统存在理想输入受限、并且存在大幅度输入受限的情况下的情况下,在辅助系统的帮助下,仍然可以实现对理想轨迹的跟踪。图9说明采用的NDO可以对不确定项进行有效估计。图10说明采用的FCE的权值在有限时间内收敛。

图1 速度跟踪效果及误差

Fig.1 Velocity tracking performance and error

图2 高度跟踪效果及误差

Fig.2 Altitude tracking performance and error

图3 高度角

Fig.3 Altitude angles

图4 俯仰角速度

Fig.4 Pitch velocity

图5 Φ变化曲线

Fig.5 Change curve of Φ

图6 χV变化曲线

Fig.6 Change curve of χV

图7 δe变化曲线

Fig.7 Change curve of δe

图8 χQ变化曲线

Fig.8 Change curve of χQ

图9 模型不确定项的估计值d̂V,θ̂γ,d̂Q

Fig.9 Model uncertainty estimation of d̂V,θ̂γ,d̂Q

图10 单网络估计权值θ̂V,θ̂γ,θ̂θ,θ̂Q

Fig.10 Fuzzy critic estimator weights of θ̂V,θ̂γ,θ̂θ,θ̂Q

4 结 论

对于存在输入受限并且含有大幅度输入受限的最优轨迹跟踪问题,本文提供了backstepping的ADP控制方法。通过对控制输入进行分解,既保证了输入受限情况下的稳定性,又实现了局部的最优控制。最终使系统渐近跟踪参考输入。文中给出的仿真实例说明了该方法的有效性。

参 考 文 献

1

卜祥伟高超声速飞行器控制研究进展[J].航空兵器20181): 47-61. [百度学术

BU Xiangwei. Progress on flight control of hypersonic flight vehilces[J]. Aero Weaponry20181): 47-61. [百度学术

2

BU X WWU X YCHEN Y Xet al. Design of a class of new nonlinear disturbance observers based on tracking differentiators for uncertain dynamic systems[J]. International Journal of Control, Automation, and Systems, 2015133): 595-602. [百度学术

3

李小兵赵思源卜祥伟高超声速飞行器保预设性能的反演控制方法[J].国防科技大学学报2020421): 73-82 [百度学术

LI XiaobingZHAO SiyuanBU Xiangweiet al. Backstepping control method for hypersonic vehicles to guarantee prescribed performance[J]. Journal of National University of Defense Technology2020421): 73-82 [百度学术

4

XU BSHI ZSUN Fet al. Barrier Lyapunov function based learning control of hypersonic flight vehicle with AOA constraint and actuator faults[J]. IEEE Transactions on Cybernetics2019493): 1047-1057. [百度学术

5

MENG WYANG QSI Jet al. Adaptive neural control of a class of output-constrained nonaffine systems[J]. IEEE Transactions on Cybernetics201616): 85-95. [百度学术

6

郭超梁晓庚王雯.基于ADP的高超声速飞行器非线性最优控制[J].火力与控制2014396): 77-81. [百度学术

GUO ChaoLIANG XiaowenWANG Wen. Nonlinear optimal control for a hypersonic vehicle based on ADP[J]. Fire Control & Command Control2014396): 77-81. [百度学术

7

MU C XNI ZSUN C Yet al. Air-breathing hypersonic vehicle tracking control based on adaptive dynamic programming[J]. IEEE Transactions on Neural Networks and Learning systems2017283): 584-598. [百度学术

8

BU X WQI Q. Fuzzy optimal tracking control of hypersonic flight vehicles via single-network adaptive critic design[J]. IEEE Transactions on Fuzzy System2020. DOI: 10.1109/TFUZZ.2020.3036706. [百度学术

9

张吉烈. 基于单网络模糊及无模型自适应动态规划最优控制方法的研究[D].辽宁东北大学2014. [百度学术

ZHANG Jilie. Researches on fuzzy and model-free optimal control based on single-network adaptive dynamic programming[D]. LiaoningNortheastern University2014. [百度学术

10

PARKER J TSERRANI AYURKOVIC Set al. Control-oriented modeling of an air-breathing hypersonic vehicle[J]. Journal of Guidance, Control, and Dynamics, 2007303): 856-869. [百度学术

11

BOLENDER M ADOMAN D B. Nonlinear longitudinal dynamical model of an air-breathing hypersonic vehicle[J]. Journal of Spacecraft and Rockets2007442): 374-387. [百度学术

12

BU X WWU X YCHEN Y Xet al. Design of a class of new nonlinear disturbance observers based on tracking differentiators for uncertain dynamic systems[J]. International Journal of Control, Automation, and Systems, 2015133): 595-602. [百度学术

13

WANG X HCHEN Z QGENG Y. Finite-time-convergent differentiator based on singular perturbation technique[J]. IEEE Transactions on Automatic Control2007529): 1731-1737. [百度学术

您是第位访问者
网站版权 © 南京航空航天大学学报
技术支持:北京勤云科技发展有限公司
请使用 Firefox、Chrome、IE10、IE11、360极速模式、搜狗极速模式、QQ极速模式等浏览器,其他浏览器不建议使用!