网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

变批次长度的非线性分布参数系统迭代学习控制  PDF

  • 李勇
  • 王玉川
  • 陈晓雷
  • 王游司
重庆邮电大学工业物联网与网络化控制教育部重点实验室,重庆 400065

中图分类号: TP273

最近更新:2023-02-22

DOI:10.16356/j.1005-2615.2022.01.020

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

针对一类离散的非线性分布参数系统,提出了一种批次长度随机变化的迭代学习控制问题。该类系统由抛物型偏微分方程构成。该方法采用伯努利型随机变量来描述迭代长度随机变化的情况,并根据分布参数系统的性质以及P型分布更新控制算法设计了迭代学习控制器。基于压缩映射原理,给出了系统输出误差收敛的充分必要条件并加以证明。结果表明,所提出的控制方法在λ范数意义下跟踪误差是收敛,且相对经典迭代学习算法,所提控制算法的收敛速度更快。最后,通过数值仿真验证了所提算法的有效性。

迭代学习控制(Iterative learning control, ILC)是一种适用于在有限时间内重复完成给定任务的智能控制策

1。自Arimoto于1984年提出ILC以2,受到广大学者的关注。经过30余年的发展,ILC被广泛应用于机械3、智能交通系4、铸5等重复过6的控制应用中。ILC作为一种简单且功能强大的控制策7,经过不断发展,已经不再局限于微分方程描述的集总参数系8,而是扩展到由偏微分方程所描述的分布参数系9,并在分布参数系统得到广泛使用。如文献[10]建立了以双曲型、抛物型或椭圆型分布参数系统的迭代学习控制的设计与分析框架,能够处理参数或者非参数的不确定性。文献[11]针对一类系数矩阵不确定但有界的抛物型分布参数系统,提出闭环P型ILC算法。与集总参数系统不同,分布参数系统的状态变量除了时间之外,还有空间变量,这使得其研究更具有挑战性。

现有的大部分ILC文献研究的批次长度固定不变,使得ILC在实际工程应用受到一定的条件限制,阻碍了ILC的发展与应用。而在实际应用中,批次长度可能是随机变化的,这就意味着学习的过程可能提前结束或者推迟。例如人形机器人的步态问

12和生物医学中上肢运动功能电刺激等实际应13。 最近几年,一些学者针对批次长度随机变化的ILC问题做了大量研14‑16。其中文献[17]采用带有Arimoto‑like增益的P型ILC算法,使得离散时间线性系统在批次长度随机变化的情况下,误差仍能够沿迭代轴渐进收敛。文献[18]则针对批次长度随机变化的离散线性系统中的ILC问题,提出了一种基于迭代平均算子的新型ILC算法。Zhang等将批次长度随机变化的ILC首次运用于分布参数系19。然而,现有文献中尚未有非线性分布参数系统的批次长度随机变化的ILC研究。

本文针对一类离散的非线性抛物型分布参数系统,根据该系统的性质和边值条件设计了P型迭代学习控制器,给出了输出误差的收敛充分条件,证明所提控制方法在范数意义下跟踪误差的收敛性,并通过仿真验证了算法的有效性。

1 系统描述

本文主要研究类离散的非线性抛物型分布参数系统批次长度随机变化的迭代学习控制问题。考虑如下的非线性分布参数系统

Δ2xk(n,t)=AΔ1xk(n-1,t)+f(xk(n,t),uk(n,t),t)yk(n,t)=Cg(xk(n,t),t)+Duk(n,t) (1)

式中:nt分别为空间和时间的离散变量,1≤nN,0≤tTNT是给定的整数;k=0、1、2…表示迭代次数;ACD为已知系统参数;xkukykR分别表示系统(1)的系统状态、系统输入和系统输出。f:R×R×0,TRg:R×0,TR均为非线性函数,且满足一致全局Lipschitz条件

f(x1,u1,t)-f(x2,u2,t)kf(x1-x2+u1-u2)g(x1,t)-g(x2,t)kg(x1-x2) (2)

式中kfkg为大于零的利普希茨常数。

系统(1)中差分形式如下

Δ2=xt=xk(n,t+1)-xk(n,t)xk(n,t)Δ1=2xn2=xk(n+1,t)-2xk(n,t)+xk(n-1,t)xk(n-1,t) (3)

设系统(1)的初值条件和边界条件分别为

xk(0,t)=xk(N+1,t)=0      1tT (4)
xk(n,0)=φk(n)      1nN (5)

式中φ(n)为一有界函数。

假设1   对于系统(1),任意的期望输出轨迹yd(n,t),存在唯一的系统输入ud(n,t)R使得

Δ2xd(n,t)=AΔ1xd(n-1,t)+f(xd(n,t),ud(n,t),t)yd(n,t)=Cg(xd(n,t),t)+Dud(n,t) (6)

假设2   满足相同的初始条件,即xk(n,0)=xd(n,0)。在实际应用中,初始状态的每次迭代可能不会被精确地重置,但偏差在小范围内变化。

本文主要研究迭代学习控制中批次长度随机变化的问题,因此必须考虑期望批次长度Td与实际批次长度Tk之间的关系。当Tk<Td时,输出信号yk(n,t)不包含tTk+1,Td上的信息,这意味着系统输出信号不完整。当TkTd时,系统可以输出整个批次长度信号,但是Td之后的信号对于学习而言是冗余和无用的,所以在本文中视TkTdTk=Td

2 算法设计与收敛性分析

2.1 算法设计

设计系统(1)的ILC方案的难点在于系统的实际批次长度可能与期望的批次长度不同,即批次长度随机变化。在批次长度随机变化的情况下,为了描述系统误差在每一时刻发生的概率,本文考虑用随机批次长度发生的概率来定义系统误差。

定义1   随机变量Tk的概率事件分布为

ΦTk(t)PTkt=0t0,Tmp(t)tTm,Td1tTd,Ti (7)

式中:Tm为系统(1)最小迭代长度,Ti为最大迭代长度。

此外,当tTk+1,…,Td}时,随机变量γk(t)服从伯努利分布,用于表示第k次迭代输出信息的有无。若γk(t)=1,表示系统输出在t时刻可测且输出在{0,1,…,Tk}之间有效。Ργk(t)=1=q(t)表示系统误差信息在t时刻可测量的概率。若γk(t)=0,则表示无法获取t时刻系统输出误差的有用信息。此种情况发生概率为Ργk(t)=0=1-q(t)。结合定义1可得

q(t)=1t0,1,2,,Tm1-p(t)tTm+1,Tm+2,,Ti (8)

定义2  k次学习后输出误差定义为

ek*(n,t)=γk(t)ek(n,t) (9)

由于γk(t)服从伯努利分布,则式(9)可表示为

ek*(n,t)=ek(n,t)t0,1,,Tk0tTk+1,Tk+2,,Td (10)

式中ek(n,t)=yd(n,t)-yk(n,t)

对系统(1),采用P型迭代学习控制算法

uk+1(n,t)=uk(n,t)+Lek*(n,t) (11)

式中:n0,Nt0,TdL为学习增益。

2.2 收敛性分析

为了便于后续的收敛性分析,本文给出了以下的引理。

引理1  

20    {v(i)}{B(i)}{D(i)}为实数序列,且i0,由

v(i+1)B(i)v(i)+D(i)      i0 (12)

那么有

v(j)i=0j-1B(i)v(0)+i=1j-1D(i)s=i+1j-1B(s)j0 (13)

定理1   考虑离散非线性抛物性分布参数系统(1)和ILC控制律(11)。如果假设条件1和2成立,且学习增益满足

sup0tTd(1-q(t)LD)2<12 (14)

那么limkek(,t)2=0

证明  u¯k(n,t)=uk+1(n,t)-uk(n,t)x¯k(n,t)=xk+1(n,t)-xk(n,t)

ek+1(n,t)=yd(n,t)-yk(n,t)+yk(n,t)-yk+1(n,t)=ek(n,t)-Cg(xk+1(n,t))-g(xk(n,t))-Du¯k(n,t)=(1-q(t)LD)ek(n,t)-Cg(xk+1(n,t))-g(xk(n,t)) (15)

式(15)两边同时取平方,可得

ek+12(n,t)=(1-q(t)LD)ek(n,t)-Cg(xk+1(n,t))-g(xk(n,t))221-q(t)LD2ek2(n,t)2C2g(xk+1(n,t))-g(xk(n,t))2 (16)

再对式(16)两边从n=1到N求和,并由式(2)可得

ek+1(,t)221-q(t)LD2ek(,t)2+2C2kgx¯k(,t)2 (17)

由式(13)可得

xk(n,t+1)=A(xk(n+1,t)+xk(n-1,t))+f(xk(n,t),uk(n,t),t)+(1-2A)xk(n,t) (18)

同理可得

xk+1(n,t+1)=A(xk+1(n+1,t)+xk+1(n-1,t))+f(xk+1(n,t),uk+1(n,t),t)+(1-2A)xk+1(n,t) (19)

再由式(19)减去式(18)

x¯k(n,t+1)=Ax¯k(n+1,t)+x¯k(n-1,t)+[f(xk+1(n,t),uk+1(n,t),t)-f(xk(n,t),uk(n,t),t)]+(1-2A)x¯k(n,t) (20)

式(20)两边同时平方,并由a+b+c23a2+3b2+3b2

x¯k2(n,t+1)=A[x¯k(n+1,t)+x¯k(n-1,t)]+[f(xk+1(n,t),uk+1(n,t),t)-f(xk(n,t),uk(n,t),t)]+(1-2A)x¯k(n,t)23A2x¯k(n+1,t)+x¯k(n-1,t)2+3[f(xk+1(n,t),uk+1(n,t),t)-f(xk(n,t),uk(n,t),t)]2+3(1-2A)2x¯k(n,t)2 (21)

式(21)的两边,同时从n=1到N求和,再利用式(2)可得

x¯k(,t+1)23A2n=1Nx¯k(n+1,t)+x¯k(n-1,t)2+3f(xk+1(n,t),uk+1(n,t),t)-f(xk(n,t),uk(n,t),t)2+3(1-2A)2x¯k(,t)23A2n=1Nx¯k(n+1,t)+x¯k(n-1,t)2+3kfu¯k(,t)2+3kf+(1-2A)2x¯k(,t)2=Ω1+Ω2+Ω3 (22)

式中

Ω1=3A2n=1Nx¯k(n+1,t)+x¯k(n-1,t)2 (23)
Ω2=3kfu¯k(,t)2 (24)
Ω3=3kf+(1-2A)2x¯k(,t)2 (25)

运用边界条件(4)和均值不等式a+b22a2+2b2可得

Ω1=3A2n=1Nx¯k(n+1,t)+x¯k(n-1,t)212A2x¯k(,t)2 (26)

式(26)代入式(22)

x¯k(,t+1)212A2+3kf+(1-2A)2x¯k(,t)2+3kfu¯k(,t)2 (27)

记:M1=sup1tTd12A2+3kf+(1-2A)2M2=3kf,则式(27)可重写为

n=1Nx¯k2(,t+1)M1i=1Nx¯k2(,t)+M2i=1Nu¯k2(,t) (28)

式(28)运用引理1和初值条件(5)可得

n=1Nx¯k2(,t+1)M1ti=1Nx¯k2(n,0)+t1=0t-1M2i=1Nu¯k2(n,t)M1t-t1-1=t1=0t-1M2i=1Nu¯k2(n,t)M1t-t1-1 (29)

由控制律(10)可得

u¯k(,t)2=L2qt2ek(,t)2 (30)

式(30)代入式(29),可以得到

x¯k(,t)2t1=0t-1M2L2q(t)2ek(,t)2M1t-t1-1 (31)

再将式(31)代入式(17)

ek+1(,t)22(1-q(t)LD)2ek(,t)2+2C2t1=0t-1M2L2q(t)2ek(,t)2M1t-t1-1 (32)

式(32)两边同时乘以λt,可得

ek+1(,t)2λt2(1-q(t)LD)2ek(,t)2λt+2C2t1=0t-1M2L2q(t)2ek(,t)2M1t-t1-1λt (33)

式中λ为正数。将式(33)重写可得

ek+1L2,λ2=ρ1+ρ2λ1-λM1ekL2,λ2 (34)

式中ρ1=sup0tTd2(1-q(t)LD)2ρ2= sup0tTd2C2M2L2q(t)2

λ取值充分小时,可使得0<ρ1+ρ2λ1-λM1<1。再根据压缩映射原理,可以得到

limkekL2,λ2=0 (35)
ek+1(,t)2=λ-tλtek+1(,t)2sup0tTdek+1(,t)2λtλ-Td=λ-TdekL2,λ2 (36)

由式(3536)可得

limkek(,t)2=0 (37)

综上所述定理1得证。

3 仿真实验

考虑如下非线性抛物型分布参数系统

Δ2xk(n,t)=2.5Δ1xk(n-1,t)+sin(xk(n,t))+0.6uk(n,t)yk(n,t)=cos(xk(n,t))+1.2uk(n,t) (38)

考虑区域n,t0,10×0,60N=10,Td=60,取初值和边值为xk(0,t)=0xk(n,0)=0。设期望输出

yd(n,t)=0.5tsinn-15sin(2πt)cost (39)

此外,设期望批次长度Td=60,最小批次长度Tm=55,最大批次长度Ti=65,实际批次长度TkTm+1,Tm+2,,Ti,满足离散均匀分布p(t)=110。学习增益L=0.7,则理论1条件sup0tTd(1-q(t)LD)2<12满足。

图1为系统期望输出曲面,图2~4分别对应在迭代3、5、12次后跟踪误差曲面。为了解变批次长度的ILC算法对非线性抛物型分布参数系统的控制效果,本文将其与经典迭代学习控制算

21相比较。图2~4的(a)图和图2~4的(b)图分别是变批次长度的ILC算法和经典ILC在迭代3、5、12次后的跟踪误差曲面。图5(a,b)分别是变批次长度的ILC算法和经典ILC在迭代第3次和第12次后的跟踪误差曲线。从图中可以看出,随着迭代次数的增加,两种算法的输出跟踪误差都逐渐减小,趋近于零。但是本文算法在迭代第5次后跟踪误差几乎趋近于0,而此时经典算法的跟踪误差仍然相对较大。在迭代12次后,本文算法的跟踪误差可以收敛到4×10-6,远远优于经典算法的5×10-3

图1  期望输出yd(n,t)

Fig.1  Desired output

图2  误差曲面(k=3)

Fig.2  Error surface (k=3)

图3  误差曲面(k=10)

Fig.3  Error surface (k=10)

图4  误差曲面(k=12)

Fig.4  Error surface (k=12)

图5  误差曲线

Fig.5  Error curves

图6是在迭代到第15次时系统输出,与期望输出几乎一致,说明本文的变批次长度的ILC算法可用于控制非线性抛物型分布参数系统。图7是本文ILC算法和经典ILC算法的历次迭代最大误差曲线,通过图7可知,所提控制算法收敛速度明显优于经典ILC算法,验证了算法对系统(1)的有效性。因此通过对比,可以看出本文采用的算法明显优于经典迭代学习算法,不仅收敛速度更快,而且跟踪精度更高。

图6  迭代15次系统输出

Fig.6  The fifteenth iterative output

图7  迭代误差最大变化曲线

Fig.7  Curves of iterative number-max tracking error

4 结 论

本文将批次长度随机变化的ILC算法应用于离散的非线性抛物型分布参数系统的控制,扩宽了ILC算法在非线性分布参数系统上的应用,对分布参数系统迭代学习控制具有重要的理论和实际意义。此外,本文实现对期望输出的渐进跟踪,并通过严格的分析证明系统的跟踪误差在范数意义下的收敛。与传统迭代算法相比,变批次迭代算法收敛速度更快。未来将进一步考虑改进算法,以提高迭代学习控制在非线性分布参数系统中的可实施性。

参考文献

1

SHEN DongXU YunZHANG Chao. Intermittent and successive ILC for stochastic nonlinear systems with random data dropouts[J]. Asian Journal of Control: Affiliated with ACPA, the Asian Control Professors’ Association,2018203):1102-1114. [百度学术] 

2

XUN M XGE S. Adaptive repetitive learning control of robotic manipulators without the requirement for initial repositioning[J]. IEEE Transactions on Robotics: A publication of the IEEE Robotics and Automation Society2006223):563-568. [百度学术] 

3

CHEN WTOMIZUKA M. Dual-stage iterative learning control for MIMO mismatched system with application to robots with joint elasticity[J]. IEEE Transactions on Control Systems Technology: A Publication of the IEEE Control Systems Society2014224):1350-1361. [百度学术] 

4

TIAN JianyanYAN GaoweiYAN Feiet al. A novel control strategy for balancing traffic flow in urban traffic network based on iterative learning control[J]. Statistical Mechanics and its Applications20185085):519-531. [百度学术] 

5

BYUNGYONG YJOOKANG LDUKMAN Let al. Iterative learning control of molten steel level in a continuous casting process[J]. Control Engineering Practice2011193):234-242. [百度学术] 

6

JI HonghaiHOU ZhongshengZHANG Ruikun. Adaptive iterative learning control for high-speed trains with unknown speed delays and input saturations[J]. IEEE Transactions on Automation Science and engineering: A Publication of the IEEE Robotics and Automation Society2016131):260-273. [百度学术] 

7

谢胜利. 迭代学习控制的理论与应用[M]. 北京科学出版社2005. [百度学术] 

XIE Shengli. The theory and application of iterative learning control[M]. BeijingScience Press2005. [百度学术] 

8

GU PanpanTIAN Senping. D-type iterative learning control for one-sided Lipschitz nonlinear systems[J]. International Journal of Robust and Nonlinear Control2019299):2546-2560. [百度学术] 

9

DAI XishengMEI SangeTIAN Senpinget al. D-type iterative learning control for a class of parabolic partial difference systems[J]. Transactions of the Institute of Measurement and Control20184010):3105-3114. [百度学术] 

10

HUANG DeqingLI XuefangXU Jianxinet al. Iterative learning control of inhomogeneous distributed parameter systems—Frequency domain design and analysis[J]. Systems and Control Letters2014728):22-29. [百度学术] 

11

DAI XishengTIAN SenpingPENG Yunjianet al. Closed-loop P-type iterative learning control of uncertain linear distributed parameter systems[J]. IEEE/CAA Journal of Automatica Sinica20143):267-273. [百度学术] 

12

XU JianxinSHEN DongZHANG Wei. Iterative learning control for discrete nonlinear systems with randomly iteration varying lengths[J]. Systems and Control Letters2016967):81-87. [百度学术] 

13

SEEL TSCHAUER TRAISCH J. Iterative learning control for variable pass length systems[J] IFAC Proceedings Volumes20111810):8330-8335. [百度学术] 

14

ZHANG WeiWANG LanjingSHEN Dong. Iterative learning control for biped walking robot with varying iteration lengths[C]//Proceedings of Chinese Control and Decision Conference. Yinchuan, ChinaIEEE20164203-4208. [百度学术] 

15

LI XuefangXU JianxinHUANG Deqing. An iterative learning control approach for linear systems with randomly varying trial lengths[J]. IEEE Transactions on Automatic Control2014597):1954-1960. [百度学术] 

16

WANG JinrongSHEN DongLIANG Chengbin. Iterative learning control for linear discrete delay systems via discrete matrix delayed exponential function approach[J]. Journal of Difference Equations and Applications20182411/12):1756-1776. [百度学术] 

17

WANG YouqingSHEN DongZHANG Weiet al. On almost sure and mean square convergence of P-type ILC under randomly varying iteration lengths[J]. Automatica201663359-365. [百度学术] 

18

LI XuefangXU JianxinHUANG Deqing. Iterative learning control for nonlinear dynamic systems with randomly varying trial lengths[J]. International Journal of Adaptive Control and Signal Processing20152911):1341-1353. [百度学术] 

19

ZHANG WeijieDAI XishengTIAN Senping. Iterative learning control for discrete distributed parameter systems with randomly varying trial lengths[J]. IEEE Access2019711):5583-5593. [百度学术] 

20

CHENG SuisunXIE Shengli. Stability criteria for parabolic type partial difference equations[J]. Journal of Computational and Applied Mathematics1996751):57-66. [百度学术] 

21

戴喜生郭亚君田森平. 非线性抛物型偏差分系统迭代学习控制[J].控制理论与应用20153212):1607-1612. [百度学术] 

DAI XishengGUO YajunTIAN Senpinget al. Iterative learning control of nonlinear parabolic partial difference systems[J]. Control Theory and Applications20153212):1607-1612. [百度学术] 

您是第位访问者
网站版权 © 南京航空航天大学学报
技术支持:北京勤云科技发展有限公司
请使用 Firefox、Chrome、IE10、IE11、360极速模式、搜狗极速模式、QQ极速模式等浏览器,其他浏览器不建议使用!