网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

网络系统的容错控制、优化与博弈研究综述  PDF

  • 姜斌
  • 许宇航
  • 杨浩
南京航空航天大学自动化学院,南京211106

中图分类号: TP13

最近更新:2022-10-28

DOI:10.16356/j.1005-2615.2022.05.005

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

网络系统是一类由多个子系统通过机械或通信相互耦合所构成的系统。该系统由于其结构复杂、耦合机制多变,具有较高发生故障的概率。随着近几年人工智能的快速发展,网络系统除了可能发生物理故障,还可能存在恶意决策,为系统的安全性带来了新的威胁。本文首先针对网络系统的物理故障,从容错控制和容错优化两个角度总结和梳理当前国内外相关的研究成果。接着,沿着容错博弈控制技术发展的脉络,从博弈控制到分别面向物理故障和恶意决策的容错博弈控制,总结了相关的研究成果。进一步,梳理了当前博弈论在集群飞行器中的应用现状,并以此抛砖引玉,希望推动容错博弈成果在航空航天领域中的应用。最后给出了几个未来值得探索的研究方向。

随着人工智能技术及其相关产业的空前发展,人类社会生活和生产的方式发生了翻天覆地的变化。从系统规模的角度来看,传统的单一、独立的控制系统早已无法满足与日俱增的生产需求,取而代之的是大规模网络化和信息化的系统。从控制技术创新的角度来看,以往通常以实现系统稳定性为主要目标;而现今,如何在保证系统稳定性的同时降低系统的能源消耗、优化系统的性能成为重要的控制目标。在这样一个生产和需求相互矛盾的时代背景下,网络系统的模型和架构应运而生。网络系统是一类由多个子系统相互耦合构成的系统,包括互联系

1‑2、多智能体系3‑4,以及近几年成为研究热点的信息‑物理系5‑6等。网络系统的耦合机制主要有两种:机械耦合和通信耦合。互联系统是一类典型的以机械耦合的网络系统,广泛应用于高速列7和智能电8等场景中。多智能体系统是一类典型的以通信耦合的网络系统,广泛应用于集群飞行9和智能交10等场景中。

在如此复杂的网络系统中,其安全性成为首要考虑的因素。然而由于机械老化、仪表失灵等因素导致的故障时有发

11,给人类的生命和财产安全带来了巨大的威胁。1979年5月25日,美国航空 191 航班,在起飞过程中发生一侧引擎脱落,引起飞机的襟翼失控,仅起飞不到1 min便发生坠毁,事故造成共273人不幸罹难。2011年7月23日,由于受到雷击等恶劣天气的影响,铁路甬温线发生数据采集回路保险管的熔断事件,致使调度中心错误地以为当前铁路区间空闲,造成两列车追尾事故和重大人员伤亡。这些事例警示故障诊断和容错控制的重要12‑13。在网络系统中,故障可分为个体故障和网络故障两种类14。个体故障指的是发生在子系统内部的故障,如执行器故障和传感器故障15‑18。这类故障首先影响的是故障子系统的稳定性,如果不加以处理,个体故障容易通过子系统之间的耦合,进而影响其他子系统的稳定性。网络故障指的是影响耦合机制的故19‑20,如通信链路故障、网络拓扑变化等。这类故障通过改变耦合机制,进而影响每个子系统的稳定性。以上两类故障都是威胁网络系统安全性的关键因素,如果处理不当,极有可能导致整个网络系统的崩溃和瓦解。

为了保障网络系统的安全性,亟需设计可靠的容错控制方法来降低甚至消除故障对系统的影响,使得系统可以稳定安全地运行。经典的容错控制方法主要分为两

21‑23:被动容错控制和主动容错控制。被动容错控24‑25基于鲁棒控制的思想,在固定控制器结构的情况下,设计对故障不敏感的控制器。当故障发生时,无需重新配置控制器,其自身对故障具有容错能力。但是这种方法只适用于预设范围内的故障,无法灵活处理预设之外的故障。为了弥补被动容错控制的局限性,主动容错控制得以发展。主动容错控26‑28通过设计故障诊断机制,采集故障信息,进行有效的故障估计,从而利用故障估计的信息来重新配置控制器,以保证系统的稳定性。

随着科学技术的不断发展,仅仅维持系统的稳定性已然不够,如何优化系统的性能成为重要的控制目标。最优控制理论为实现系统性能的优化提供了结实的理论基

29‑30。最优控制理论不仅可以有效地处理网络系统中各个子系统的动力学约束,还可以处理其他附加约束条件,比如最小能耗和最短时间等特殊的需求。而针对具有多个子系统的网络系统,其优化过程往往面临着双边或者多边共同优化的问题。博弈论成为处理这类问题的一个强有力的工具。

博弈论大致诞生于二战之后,起源于经济学,博弈论之父——冯诺依曼教授所著的《博弈论与经济行为》是博弈论学科的奠基性著

31。20世纪60年代,数学家Issacs 教授在研究追逃问题时,将最优控制理论中的相关概念和思想引入博弈论中,进而催生了微分对策理32。而在国内,张嗣瀛院士是微分对策理论与应用研究的先驱。他建立了一套完整的定量和定性的微分对策的理论体33,并将其成功地应用于导弹制导等军事场景中。博弈论和控制论的关系就好比一对孪生兄34。它们最大的相同之处在于优化所设定的目标;最大的区别在于研究对象的智能化程度不同。控制论面向的是非智能化的系统,而博弈论面向的是智能化的玩家。因此,博弈论中的玩家像“人”一样拥有自私属性,并发挥这种自私属性,试图将自己的利益最大化。博弈论和控制论在各自发展了大半个世纪之后, 在今天由于系统对象的复杂化和控制目标的多样化而融合到一起,从而诞生了一个新兴的交叉学科——博弈控制论。由于博弈控制论具有灵活处理多边冲突、合作与竞争关系的能力,其诸多优点和巨大的应用潜力已经被广大学者认可,近几年陆续取得了一系列代表性的成35‑39。而值得一提的是,在博弈论和容错控制理论的交叉领域,其相关成果几乎空白,至今鲜见。

博弈论在航空航天领域发挥着重要作用,特别是集群飞行器的相关领域,博弈论可以迎合集群飞行器的任务需求,设计不同的博弈类型,实现规定的任务目标并优化系统的性能。根据集群的结构特点,其编队控制的设计可以分为基于领导者‑跟随者模式的编队控制、基于行为模式的编队控制和基于虚拟结构的编队控制

40‑42。基于集群的结构特点,设计对应的容错控制方法能够有效提升集群飞行器的安全性43,从而降低由于物理故障导致的经济损失。在此基础上,根据集群飞行器任务分配、航迹规划和编队控制3个环节各自的特点,设计面向博弈的机制,能够有效提升无人机决策的智能性,使集群性能达到更高的品质要求。

基于以上研究背景,本文将紧紧围绕以下问题进行梳理总结。

问题描述 考虑两类典型的网络系统,即通过机械耦合的互联系统和通过网络耦合的多智能体系统,并以此类网络系统的容错控制、优化与博弈为研究目标来梳理国内外相关的研究成果。

下面将从网络系统的容错控制、容错优化和容错博弈3个角度梳理现有的研究成果,并总结博弈论在集群飞行器中的应用现状,最后给出几个未来值得深入研究的方向。

1 网络系统的容错控制

本节首先总结网络系统中3种常用的控制器结构,接着根据容错控制方法的不同特点,梳理网络系统容错控制的研究成果。

1.1 控制器结构

根据网络系统中各个子系统之间信息交互的不同方式,容错控制器的结构可分为3种类型:集中式容错控制

44、分布式容错控制45 和分散式容错控制46。3类容错控制器的特点如图1所示。

图1  网络系统容错控制器的结构

Fig.1  Structure of fault-tolerant controllers for network systems

3种容错控制器的优缺点总结如下。

(1) 集中式控制器:在网络系统中设计一个集中监测器,所有的子系统将自己的信息传递给集中监测器,再通过监测器把信息传播给各个子系统。其造价昂贵,仅适用于规模较小的网络系

47

(2) 分布式控制器:每个子系统均可以获取其自身的信息以及邻居子系统的信息。相较于集中式控制器,分布式控制器有助于节省信息交互的代价。因此,分布式控制器更适用于大规模的网络系

48

(3) 分散式控制器:每个子系统仅获取与自身相关的信息。因此,分散式控制器结构较为简单,且易于实现,然而通常对系统的拓扑结构有较强的约

49‑50

1.2 容错控制方法

根据网络系统容错控制方法的不同特点,其容错控制方法可以分为独立容错控制和协同容错控

14。独立容错控制方法通过单独调节故障子系统的控制器实现网络系统的容错目标;协同容错控制方法通过综合调节故障子系统和健康子系统的控制器实现网络系统的容错目标。针对这两种容错控制方法,目前已经取得了相当丰富的研究成果。下面分别梳理这两种容错控制方法的研究成果。

独立容错控制方法延续传统的被动/主动容错控

21‑22的思想,实现网络系统的容错目标。文献[51]针对存在执行器故障和领导者未知有界输入的多智能体系统,设计在线故障估计算法,并基于此设计自适应容错跟踪控制,保证系统的稳定性。文献[52]基于分布式观测器实现自适应故障估计,并将估计的故障作为补偿项设计容错控制器,保证多智能体的期望编队构型。进一步,文献[53]为分布式故障估计器设计了一个可调参数,有效地改善了故障估计的精确度。此外,人工智能相关的技术,例如模糊控制、神经网络控制等也已渗透入容错控制的领域。文献[54]结合模糊控制理论,设计了自适应模糊跟踪容错控制方法,有效地解决了多智能体系统存在未知系统动态和时变执行器故障的问题;文献[55]基于神经网络技术,设计在线故障估计器,通过最小化估计误差获得最优神经网络的权重,进而尽可能精准地逼近故障的信息。文献[56]针对发生执行器故障的多智能体系统设计了基于迭代学习的智能容错控制算法,从而摆脱了对精准参考轨迹的依赖。文献[57]针对非线性互联系统,将耦合项当作是子系统的不确定项,进而设计鲁棒容错控制器,有效实现了对故障的补偿。文献[56‑57]通过结合人工智能领域的相关方法,成功将针对单个智能体的容错控制方法推广至网络系统中实现其智能独立容错控制。文献[58]设计了分布式鲁棒跟踪控制器,有效解决了互联系统同时发生执行器故障和耦合故障时的容错控制的问题。

协同容错控制方法基于耦合机制的特点,量身定制网络系统的容错控制。文献[

59]针对具有机械耦合的互联系统,提出基于环小增益原理的协同容错控制方案;其主要思想为通过同时调整故障和健康子系统的控制增益,使得小增益条件得以满足,保证整个互联系统的稳定性。该方法首次提出协同容错控制的思想,通过健康智能体和故障智能体之间的相互协作共同完成容错目标,有效弥补了单个子系统容错能力的不足。文献[60]进一步地将研究成果推广至非线性互联系统,实现其容错安全控制。文献[61]针对多智能体系统发生执行器故障的情形,设计了分布式有限时间观测器,并基于此设计分布式自适应容错控制器保证系统在有限时间内收敛至理想值。文献[62]提出基于分数阶(Proportional integral derivative,PID)的自适应协同容错控制方法,实现网络化无人机在执行器故障和风扰的双重影响下的安全控制。

独立容错控制方法是传统的单个系统的容错控制方法的直接推广。协同容错控制方法则立足于网络系统的耦合特性,进而开发出的新的容错控制方法。较之于独立容错控制方法,协同容错控制方法通过充分调动健康子系统的控制器,从而有效地避免了故障子系统容错能力的不足,保证了容错目标的顺利完成。

2 网络系统的容错优化

在保证网络系统稳定性的基础上,网络系统的性能也备受关注。本节将从网络系统的局部性能优化和全局性能优化两个角度,梳理有关网络系统容错优化的研究成果。

2.1 局部系统的性能优化

局部系统性能优化关注的是容错过程中子系统的性能变化情况。文献[

63]针对线性多智能体系统的3种执行器故障:失效故障、卡死故障和浮动故障,建立其稳定性和局部最优性能的条件。研究表明,失效故障和卡死故障不会影响系统的稳定性和团队的一致性,但是会影响智能体的收敛速率。不同于以上两种故障类型的影响,浮动故障将会影响多智能体系统的一致性,而不影响系统的稳定性。进一步,文献[63]设计了一个协同容错控制方案使得领导者和健康跟随者的策略可以随着故障跟随者策略的变化而变化。文献[64]针对非线性多智能体系统提出了一个协同容错控制方案,揭示了通讯协议和协同控制性能之间的关系,并且通过调整健康多智能体的控制率来实现多智能体的集结。

除了建立关于智能体本身的性能指标,还可以建立关于故障的指标作为控制器重构的依据。文献[

65]建立了一个量化故障估计不准确性的指标,并构建其与多智能体一致性之间的联系。所设计的性能指标可以用来帮助重构健康智能体的权重,从而有效地弥补故障智能体对系统性能的影响。

2.2 全局系统的性能优化

全局系统的性能优化关注的是容错控制过程中子系统局部性能和全局系统性能之间的平衡关系。文献[

66‑67]建立了一个分层协同容错控制的框架,如图2所示。整个分层协同容错控制由3层构成:底层为子系统容错层,中间为队形恢复层,顶层为性能监测层。子系统容错层负责通过设计独立容错控制方案实现对故障的补偿。队形恢复层通过调节健康子系统的控制器来补偿整个多智能体系统由于故障产生的性能损失,保证系统的稳定性。性能监测层负责综合协调子系统容错层和队形恢复层,从而在最小化代价的情况下实现容错目标。为了应对复杂多变的实际环境,这个分层协同容错控制的框架被进一步扩展至离散系68中实现其容错控制的目标。以上文献说明了分层协同容错控制框架在理论上的完备性,以及在各类复杂系统中的可扩展性。不仅如此,该协同容错控制框架还被广泛地应用于航空航天领域,例如飞行器编队和卫星编69‑70,有效保障了系统的安全性。

图2  分层协同容错控制框架

Fig.2  Framework of hierarchical cooperative fault-tolerant control

另一种行之有效地可以同步实现子系统性能优化和全局系统性能优化的方法是微分博弈。文献[

71]针对同时具有状态耦合和输入耦合的互联系统,提出基于零和微分图博弈的被动容错最优控制方法。通过在每个子系统内部构建零和博弈,设计鲁棒最优控制器,并且在每个子系统之间构建图博弈,实现全局Nash均衡。为了降低被动容错最优控制方法的保守性,文献[72]针对互联系统及其诊断观测器之间存在的双向交互影响而导致的分离原理无法成立的问题,提出基于斯坦伯格微分图博弈的主动容错最优控制方法。通过分析互联系统与其对应的诊断观测器之间的双向交互影响,揭示两者的运行机理,建立其主从决策机制,进而将互联观测器作为跟随者,设计分布式最优故障估计,并且将互联系统作为领导者,利用故障估计的信息,进一步设计分布式容错最优控制器。所设计的控制策略可以保证闭环互联系统的渐近稳定性,并实现博弈的交互式斯坦伯格均衡。

局部系统性能优化方法有利于各个子系统在容错过程中单独实现各自的控制目标并进行自身系统的优化,然而由于网络系统中各个子系统相互耦合,一个子系统的性能优化可能会引起其他子系统性能的降级。为了解决这个问题,全局系统优化方法油然而生。这种方法在容错控制过程中同时兼顾了子系统局部性能和全局系统性能之间的关系,有效化解了两者相互矛盾的问题。

3 网络系统的容错博弈

本节沿着容错博弈控制技术发展的进程,从网络系统的博弈控制到面向物理故障的容错博弈控制再到面向恶意决策的容错博弈控制,梳理当前相关的研究成果。

3.1 网络系统的博弈控制

博弈控制论通过融合博弈论和控制论的共同优点,为实现网络系统的多方优化问题提供了强有力的理论基

73。根据玩家之间关系的不同,博弈分为多种类型,如零和博7475‑77、追逃博3278 和斯坦伯格博79‑80等。下面分别从零和博弈、追逃博弈和斯坦伯格博弈3个方面总结国内外博弈控制的研究成果。

零和博弈具有玩家双方代价之和为零的特点,即,一方获利,则另一方必然利益受

73。利用这个特点,文献[74]基于零和博弈,设计多智能体系统的H控制器,有效地抑制了外界扰动对智能体的影响。文献[75]针对导弹拦截制导的问题,设计一对一的鲁棒拦截制导率,保证导弹打击的精准度。文献[76]将事件触发问题中的控制器和控制输入误差的阈值当做是零和博弈中两个对抗的玩家,将最坏情况下控制输入误差作为阈值来设计事件触发的条件。文献[77]将信息‑物理系统中攻击和防御的问题转化为零和博弈的问题,进而设计攻击检测机制和弹性安全控制策略来抵御攻击的侵扰,保障信息‑物理系统的安全。零和博弈在控制领域可以理解为一种鲁棒控制,面对一定预设范围内的对抗策略,所设计的另一方的博弈策略可以保证预期目标得以实现。

追逃博弈的玩家为追击者和逃逸者,追击者的目标是追捕逃逸者,而逃逸者的目标是逃离追击者的追

3278。追逃博弈的问题通常可以转化为零和博3278或者非零和博81‑83来研究。文献[78]将航天器之间的追逃博弈问题转化为零和博弈的问题,通过设计追逃双方航天器的反馈控制率,形成零和博弈的鞍点,保证逃逸者可以被成功捕获。针对多追1的追逃博弈问题中存在追捕双方视野差异的情形(即追击者只能观测到部分逃逸者和部分追击者的情况,而逃逸者可以观测到所有追击者的实际情况),文献[82]通过改进性能指标,设计最优追捕策略,保证追捕任务可以顺利完成。文献[84]基于非零和博弈设计多追多的追逃博弈策略,有效实现了有限时间内对逃逸者的捕获,并保证追击者系统的渐近收敛性。针对出现超级逃逸者的情形,即逃逸者的速度比追击者的速度快,文献[84]设计了一套合作包围逃逸者的方案,依靠团队合作,逮捕逃逸者。进一步,文献[85]研究追击者和逃逸者的角色不断切换的目标‑攻击‑防御博弈,其中攻击者既需要扮演逃逸者,逃离防御者的追击,也需要扮演追击者,负责打击目标。在这样一个角色需要切换的追逃博弈中,文献[85]分析了攻击者打击目标成功的可能性,并针对不同的追捕阶段,设计目标和防御者的控制策略,保证追捕任务的顺利完成。

斯坦伯格博弈的玩家由领导者和跟随者构

86,因此又称之为主从博弈。这类博弈的特点是领导者和跟随者构成主从决策机制。其中,领导者有“一步优先权”,可以将自身策略强加给跟随者,在跟随者收到领导者发布的策略之后,跟随者会随之做出最佳响应。与此同时,领导者具有观察当前局势的能力,可以根据跟随者的策略调整自身的策略,进而做出当前最有利于自己利益的决策。文献[79]基于斯坦伯格博弈主从决策的特点,研究智能电网中的供电公司和终端用户之间的供需关系,分析如何合理定价的问题。在供电公司和终端用户只能获取局部信息的情况下,设计分布式算法,保证其可以收敛至斯坦伯格均衡点。文献[80]研究在平均场的影响下,由一个领导者和N个跟随者构成的斯坦伯格博弈的问题,提出了最优分散式控制器,所设计的控制策略可以收敛至改进的斯坦伯格‑纳什均衡点。文献[39]针对网络系统受到虚假数据注入攻击的问题,利用斯坦伯格博弈设计防御者的策略,以最大程度地保护防御者的资源。

3.2 网络系统的容错博弈控制

虽然博弈控制论在各个领域呈现百花齐放之态势,然而目前针对容错控制和博弈控制的交叉研究领域的成果比较罕见。文献[

87]针对追逃博弈中追击者和逃逸者发生执行器故障的情形,采用传统的主动容错控制技术,建立故障估计器,设计容错最优控制器来补偿故障对网络系统的影响,保证逃逸者可以被成功捕获。文献[88]建立了电动车的4个执行器发生故障情况下的合作博弈,通过设计帕累托最优解实现其容错控制。文献[89]进一步研究人的行为对容错控制的影响,进而减轻了电动车的工作负载。此类基于博弈的容错控制拥有一个共同的特点:博弈的特性仅体现在各个子系统之间,而所采取的容错控制方法仍为传统的主动容错控制或者被动容错控制,可称之为外环容错博弈控制。为了让容错控制本身带上博弈色彩,文献[71‑72]设计内外环容错博弈控制,通过深入挖掘控制器和故障之间博弈的机理设计了互联系统的分布式被动和主动容错最优控制方法,同步实现了子系统性能和全局系统性能的优化,并摆脱了互联系统的主动容错控制对分离原理的依赖。这种方法利用博弈将传统的主动和被动容错控制方法的工作机理加以实现,有效地解决容错目标和系统优化目标相互矛盾的问题。

在博弈控制中,除了物理部件会发生故障,由于博弈本身的特性,玩家还有可能出现恶意决策的情形。相较于客观因素造成的物理故障,恶意决策具有玩家的主观性,带有玩家的个人感情色彩,体现玩家感知能力的差异性。恶意决策的相关研究起始于行为学,近年来随着人工智能的发展,慢慢渗透至工程领域。特别是针对人机交互的系

90,如智能交通网络等系统,研究其恶意决策行为对提升网络系统的安全性具有重要意义。文献[91]建立分层感知的框架,赋予每个智能体不同的感知水平以处理各种不同的突发状况。文献[92]提出一种基于强化学习的算法,以迭代的形式来捕捉智能体不同等级的想法和行为。文献[93]通过在性能指标中设计吸引因子和排斥因子,研究蜂群的觅食行为。目前现有文献大多以移除恶意决策个体为主要解决方94。虽然这种方法可以减轻恶意个体对全局系统的负面影响。然而,面对具有几何约束和动态约束的网络系统,比如蜂群,这种方法不具有普适性。因为在蜂群中,移除恶意个体非常有可能造成正常个体和恶意个体之间的碰撞,从而导致蜂群的瓦解。另一方面,大多数关于恶意个体的研究成果关注的是由于资源或者通信交流限制等客观因素造成的个体有限理性行为。为了研究主观恶意行为对博弈的影响,文献[95]建立了3类具有主观恶意决策行为的追击者:贪婪型、懒惰型和背叛型追击者,设计协同容错博弈方法,并从可追捕性、Nash 均衡和追捕时间3个方面分析了恶意决策对系统稳定性和博弈均衡性的影响。相较于基于鲁棒控制思想设计的容错博弈控制方法,文献[95]通过设计协同容错追捕方案实现了对逃逸者的合作围捕,在面对不同类型的恶意追击者时,具有更强的容错能力。

4 博弈论在集群飞行器中的应用

本节以集群飞行器执行任务过程中核心的3个环节:任务分配、航迹规划和编队控制为线索,总结和梳理博弈论在集群飞行器上的应用成果,并分析当前研究现状中3个环节的设计特点以及不足之处。

集群飞行器作为一类以通信耦合的网络系统,在军事和民用方面都发挥着重要作用,例如森林防

96、敌情监97等。近几年,众多学者开始将博弈论应用于在集群飞行器上,以寻求更优的系统性能。

在任务分配环节,联盟编队博弈及其衍生的博弈可以帮助建立无人机的个体偏

98‑102,进而将无人机分成不同的簇,实现多线程多区域的无人机的部署。文献[100]基于享乐联盟编队博弈,建立无人机的自私偏好,使得在无人机在仅关注自身利益的情况下完成任务分配。此方法有利于提高无人机对环境的适应能力,使其可以灵活地应对新任务的加入和旧任务的移除。除了自私偏好,文献[101]基于联盟编队博弈建立了无人机的利他偏好,使得无人机在考量自身利益的情况下,同时考量团队的集体利益,有效实现了无人机的任务和频谱的双重分配。进一步,随着无人机的个体偏好从关注联盟成员的身份转换成了关注联盟成员的数量,文献[102]建立匿名享乐博弈,研究了具有社会性抑制特性的无人机,在尽可能减少合作成员的情况下,实施联盟切换准则,形成与任务匹配的 Nash 稳定的无人机分区。从以上文献中可以看出联盟编队博弈及其衍生的博弈可以充分考量无人机的个体偏好,赋予无人机犹如人一样的社会属性,例如自私、利他和社会性抑制等属性,进而无人机可以根据自己的喜好,选择距离近的,燃油消耗较少的任务,以及选择想要合作的联盟成员。因此,在联盟编队博弈框架下的无人机越来越趋于智能化,符合当前人工智能的时代背景,拥有巨大的应用前景。

在航迹规划环节,博弈可以适合集群所具有的系统规模庞大、通信耦合密切的特点,实现无人机路径的自主规划,并同时实现自主避障、最小化能耗等多方面的功

103‑106。文献[104]基于非零和博弈,实现避障条件约束下的无人机期望飞行轨迹的规划。基于这个理论,文献[105]设计了一个在线运行的机制,实现了轨迹规划和轨迹跟踪的同步优化。面向具有作战需求的集群飞行器,文献[106]将前景理论引入至博弈论中,建立无人机对作战时间的主观评估以及对风险的感知能力,实现无人机最优攻击路径的选择,从而在尽可能降低自身损耗的情况下,保护目标点的资源。

在编队控制环节,博弈能够有效地刻画各个无人机的不同目标,实现多无人机的一致性与构型保

107‑113。文献[107]基于非合作博弈,实现了领导者-跟随者模式的集群编队控制。进一步,通过将非合作博弈和收缩区间技术相结合,可以实现编队飞行过程中的完全分布式控108。文献[109‑110]基于Shapley值建立各架无人机贡献评价机制,利用超模博弈中策略互补的特性,可以选出最适合担任领导者的无人机,进而实现有限领导者数量约束下性能指标的优化,以及有限性能约束下领导者数目的优化。文献[111]针对存在外界扰动的编队控制,构建零和博弈,有效地保证无人机编队过程中的鲁棒性,并且设计了分布式编队控制策略,有效地降低信息交互的代价。在编队重构的场景中,文献[112]运用多目标多人博弈将编队重构控制转化为纳什谈判过程,结合分布式模型预测控制方法,实现无人机的威胁规避、协同保护和相互支援, 同时有效降低无人机编队自主重构控制问题的求解规模。

值得一提的是,在博弈框架下,目前集群飞行器的任务分配、航迹规划和编队控制3个环节的策略通常是分开独立设计的。这有利于实现每个环节的目标,并顺着任务分配→ 路径规划→ 编队控制的方向正向调节每个环节的性能,可称之为开环设计。然而这种开环设计忽略了各个环节之间的双向互动,无法建立反馈机制,难以根据实际情况对策略进行及时地调整。因此,亟需建立针对3个环节一体化的博弈机制,使得每个环节的性能可以双向可调。据调研,目前尚未有相关的研究成果。

5 结 论

本文从网络系统的容错控制、容错优化和容错博弈3个角度总结了国内外相关的研究成果,并根据研究的问题、异常行为的类型以及所采取的容错控制方法将现有的代表性文献进行分类,总结为表1。进一步,梳理了博弈论在集群飞行器中的应用情况。下面给出未来值得继续深入探索的研究方向。

表1  网络系统的容错控制、优化与博弈的相关研究成果
Table 1  Representitive studies on fault‑tolerant control, optimization, and game for network systems
研究问题异常行为类型所采用的方法代表性文献

网络系统

容错控制

部件故障 独立容错控制 [51](2015年)、[52](2018年)、[53](2017年)、[54](2014年)、[55](2004年)、[56](2018年)、[57](2011年)、[58](2009年)
协同容错控制 [59](2015年)、[60]2020年)、[61](2019年)、[62](2021年)

网络系统

容错优化

部件故障 局部系统性能优化 [63](2010年)、[64](2011年)、[65](2015年)
全局系统性能优化 [66](2011年)、[67](2012年)、[68](2012年)、[69](2007年)、[70](2012年)、[71](2020年)

网络系统

容错博弈

部件故障 外环容错博弈控制 [88](2020年)、[89](2021年)
内外环容错博弈控制 [71](2020年)、[72](2022年)
恶意决策 鲁棒容错控制 [93](2016年)、[94](2011年)
协同容错控制 [95](2022年)

(1) 随着科学技术的高速发展,现代控制系统呈现出复杂化和网络化的特点,其故障特性更加难以捉摸。如何结合切换系统理论、非线性系统理论和图论等理论知识,设计针对一般性线性/非线性网络系统且满足时变/切换等多种通信拓扑结构需求的容错博弈控制技术是一个挑战。

(2) 博弈论作为多边优化的有力工具,具有冲突消解的能力,如何将博弈论和容错控制理论恰如其分地融合,发挥学科交叉的优势,从而推动容错控制理论的发展是未来一个重要的研究方向。值得一提的是,目前控制领域广泛使用的零和博弈、非零和博弈等微分博弈,仅为博弈论的冰山一角。博弈论中尚存大量的博弈类型,比如共演化博弈、超模博弈等,如何汲取这些博弈的思想,并将其引入至容错控制领域,解决容错控制中难以解决的问题是一个值得深入研究的课题。

(3) 发展人工智能乃大势所趋,如何实现人‑机混合增强智能是一个值得深入研究的课题。通过结合前景理论、强化学习和深度学习等理论,研究人类行为对容错博弈控制的影响,进而设计智能容错博弈控制算法,有助于从智能决策和智能学习两个维度提升系统的安全性。

(4) 当前容错博弈控制技术大多处于理论研究阶段,未来亟需将容错博弈控制技术应用于例如卫星组网、集群无人机和智能电网等实际网络系统中,实现其安全可靠的运行,这将具有重要的实际应用价值。

参考文献

1

PANAGI PPOLYCARPOU M M. Decentralized fault-tolerant control of a class of interconnected nonlinear systems[J]. IEEE Transactions on Automatic Control2011561): 178-184. [百度学术] 

2

TONG ShaochengHUO BaoyuLI Yongming. Observer-based adaptive decentralized fuzzy fault-tolerant control of nonlinear large-scale systems with actuator failures[J]. IEEE Transactions on Fuzzy Systems2014221): 1-15. [百度学术] 

3

REN WeiCAO Yongcan. Distributed coordination of multi-agent networks: Emergent problems, models, and issues[M]. London,UKSpringer-Verlag2010. [百度学术] 

4

LIU ChunJIANG BinPATTON R Jet al. Hierarchical structure-based fault estimation and fault-tolerant control for multi-agent systems[J]. IEEE Transactions on Control of Network Systems201962): 586-597. [百度学术] 

5

AN LiweiYANG Guanghong. Enhancement of opacity for distributed state estimation in cyber-physical systems[J]. Automatica2022136110087. [百度学术] 

6

ZHANG TianyuYE Dan. False data injection attacks with complete stealthiness in cyber-physical systems: A self-generated approach[J]. Automatica2020120109117. [百度学术] 

7

ZHAGN KangkangJIANG BinYAN Xingganget al. Incipient voltage sensor fault isolation for rectifier in railway electrical traction systems[J]. IEEE Transaction on Industrial Electronics2017648): 6763-6774. [百度学术] 

8

ETESAMI S RSAAD WMANDAYAM N Bet al. Smart routing of electric vehicles for load balancing in smart grids[J]. Automatica2020120109148. [百度学术] 

9

DUAN HaibinLI Pei. Bio-inspired computation in unmanned aerial vehicles[M]. Berlin, GermanySpringer Heidelberg2014. [百度学术] 

10

AUTILI MCHEN LENGLUND Cet al. Cooperative intelligent transport systems: Choreography based urban traffic coordination[J]. IEEE Transactions on Intelligent Transportation Systems2021224): 2088-2099. [百度学术] 

11

WILLSKY A S. A survey of design methods for failure detection in dynamic systems[J]. Automatica1976126): 601-611. [百度学术] 

12

张育林李东旭. 动态系统故障诊断与应用[M]. 长沙国防科技大学出版社1997. [百度学术] 

ZHANG YunlinLI Dongxu. Fault diagnosis and application of dynamic systems[M]. ChangshaNational University of Defense Science and Technology Press1997. [百度学术] 

13

周东华孙优贤. 控制系统的故障检测与诊断技术[M]. 北京清华大学出版社1994. [百度学术] 

ZHOU DonghuaSUN Youxian. Fault detection and diagnosis technology of control systems[M]. BeijingTsinghua University Press1994. [百度学术] 

14

杨浩姜斌周东华. 互联系统容错控制的研究回顾与展望[J]. 自动化学报2017431): 9-19. [百度学术] 

YANG HaoJIANG BinZHOU Donghua. Review and prospect of fault-tolerant control of interconnected systems[J]. IEEE/CAA Journal of Automatica Sinica2017431): 9-19. [百度学术] 

15

PATTON R JFRANK P MCLARK R N. Issues of fault diagnosis for dynamic systems[M]. London, UKSpring-Verlag2000. [百度学术] 

16

ZHANG YoumingJIANG Jin. Bibliographical review on reconfigurable fault-tolerant control systems[J]. Annual Review Control2000322): 229-252. [百度学术] 

17

LI YongmingMA ZhiyaoTONG Shaocheng. Adaptive fuzzy output-constrained fault-tolerant control of nonlinear stochastic large-scale systems with actuator faults[J]. IEEE Transactions on Cybernetics2017479): 2362-2376. [百度学术] 

18

CHEN GangSONG YongduanLEWIS F L. Distributed fault-tolerant control of networked uncertain Euler-Lagrange systems under actuator faults[J]. IEEE Transactions on Cybernetics2017477): 1706-1718. [百度学术] 

19

YANG HaoSTAROSWIECXKI MJIANG Binet al. Fault-tolerant cooperative control for a class of nonlinear multi-agent systems[J]. Systems & Control Letters2011604): 271-277. [百度学术] 

20

GE XiaohuaHAN QinglongYANG Fuwen. Event-based set-membership leader-following consensus of networked multi-agent systems subject to limited communication resources and unknown but bounded noise[J]. IEEE Transactions on Industrial Electronics2017646): 5045-5054. [百度学术] 

21

胡昌华许化龙. 控制系统故障诊断与容错控制的分析和设计[M]. 北京国防工业出版社2000. [百度学术] 

HU ChanghuaXU Hualong. analysis and design of fault diagnosis and fault-tolerant control of control systems[M]. BeijingNational Defense Industry Press2000. [百度学术] 

22

姜斌冒泽慧杨浩. 控制系统的故障诊断与故障调节[M]. 北京国防工业出版社2009. [百度学术] 

JIANG BinMAO ZehuiYANG Hao. Fault diagnosis and fault adjustment of control systems[M]. BeijingNational Defense Industry Press2009. [百度学术] 

23

JIANG JinYU Xiang. Fault-tolerant control systems: A comparative study between active and passive approaches[J]. Annual Reviews in Control2012361): 60-72. [百度学术] 

24

GAO ZhifengJIANG BinSHI Penget al. Passive fault-tolerant control design for near-space hypersonic vehicle dynamical system[J]. Circuits, Systems, and Signal Processing2012312): 565-581. [百度学术] 

25

BENOSMAN MLUM K Y. Passive actuators fault-tolerant control for affine nonlinear systems[J]. IEEE Transactions on Control Systems Technology2010181): 152-163. [百度学术] 

26

SHEN QikunJIANG BinCOCQUEMPOT V. Adaptive fuzzy observer-based active fault-tolerant dynamic surface control for a class of nonlinear systems with actuator faults[J]. IEEE Transactions on Fuzzy Systems2014222): 338-349. [百度学术] 

27

GAO ZhifengJIANG BinSHI Penget al. Active fault-tolerant control design for reusable launch vehicle using adaptive sliding mode technique[J]. Journal of the Franklin Institute20123494): 1543-1560. [百度学术] 

28

ZEHACHE SBENSLIMANE TBOUGUERRA A. Active fault-tolerant control based on interval type-2 fuzzy sliding mode controller and nonlinear adaptive observer for 3-DOF laboratory helicopter[J]. ISA Transactions201771280-303. [百度学术] 

29

胡寿松王执铨胡维礼. 最优控制理论与系统[M]. 北京科学出版社2005. [百度学术] 

HU ShousongWANG ZhiquanHU Weili. Optimal control theory and systems[M]. BeijingScience Press2005. [百度学术] 

30

LEWIS F LVRABIE DSYRMOS V L. Optimal control[M]. HobokenJohn Wiley & Sons2012. [百度学术] 

31

MORGENSTERN ONEUMANN J. Theory of games and economic behavior[M]. New Jersey, USAPrinceton University Press1944. [百度学术] 

32

ISSACS R. Differential games: A mathematical theory with applications to warfare and pursuit, control and optimization[M]. New York, USADover Publications1999. [百度学术] 

33

张嗣瀛. 微分对策[M]. 北京科学出版社1987. [百度学术] 

ZHANG Shiying. Game theory[M]. BeijingScience Press1987. [百度学术] 

34

程代展付世华. 博弈控制论简述[J]. 控制理论与应用2018355): 588-592. [百度学术] 

CHENG DaizhanFU Shihua. A survey on game control[J]. Control Theory and Application2018355): 588-592. [百度学术] 

35

谭拂晓刘德荣关新平. 基于微分对策理论的非线性控制回顾与展望[J]. 自动化学报2014401): 1-15. [百度学术] 

TAN FuxiaoLIU DerongGUAN Xinpinget al. Review and prospect of nonlinear control based on differential game theory[J]. IEEE/CAA Journal of Automatica Sinica2014401): 1-15. [百度学术] 

36

MOON JBASAR T. Linear quadratic risk-sensitive and robust mean field games[J]. IEEE Transactions on Automatic Control2017623): 1062-1077. [百度学术] 

37

MOLLOY T LINGA JFLAD Met al. Inverse open-loop noncooperative differential games and inverse optimal control[J]. IEEE Transactions on Automatic Control2020652): 897-904. [百度学术] 

38

YE MaojiaoHU GuoqiangXIE Lihuaet al. Differentially private distributed Nash equilibrium seeking for aggregative games[J]. IEEE Transactions on Automatic Control2021.DOI: 10.1109/TAC.2021. 3075183. [百度学术] 

39

LI YuzeSHi DaweiCHEN Tongwen. False data injection attacks on networked control systems: A Stackelberg-game analysis[J]. IEEE Transactions on Automatic Control20186310): 3503-3509. [百度学术] 

40

ZHANG JunXing Jinhao. Cooperative task assignment of multi-UAV system[J]. Chinese Journal of Aeronautics20203311): 2825-2827. [百度学术] 

41

YU ZiquanQU YaohongZHANG Youming. Distributed fault-tolerant cooperative control for multi-UAVs under actuator fault and input saturation[J]. IEEE Transactions on Control Systems Technology2018276): 2417-2429. [百度学术] 

42

YU ZiquanZHANG YoumingJIANG Binet al. A review on fault-tolerant cooperative control of multiple unmanned aerial vehicles[J]. Chinese Journal of Aeronautics2022351): 1-18. [百度学术] 

43

LIU ChunJIANG BinZHAHG Ke. Adaptive fault-tolerant H-Infinity output feedback control for lead-wing close formation flight[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems2018508): 2804-2814. [百度学术] 

44

LOCATWLLI ASCHIAVONI N. Reliable regulation in centralized control systems[J]. Automatica2009452673-2677. [百度学术] 

45

KHALILI MZHANG XiaodongPOLYCARPOU M Met al. Distributed adaptive fault-tolerant control of uncertain multi-agent systems[J]. Automatica201887147-151. [百度学术] 

46

XIE ChunhuaYANG Guanghong. Decentralized adaptive fault-tolerant control for large-scale systems with external disturbances and actuator faults[J]. Automatica20178583-90. [百度学术] 

47

ANGULURI RKATEWA VPASQUALETTI F. Centralized versus decentralized detection of attacks in stochastic interconnected systems[J]. IEEE Transactions on Automatic Control2020659): 3903-3910. [百度学术] 

48

BARBONI AREZAEE HBOEM Fet al. Detection of covert cyber-attacks in interconnected systems: A distributed model-based approach[J]. IEEE Transactions on Automatic Control2020659): 3728-3741. [百度学术] 

49

LI XiaomeiTONG Shaocheng. Adaptive neural networks decentralized FTC design for non-strict feedback nonlinear interconnected large-scale systems against actuator faults[J]. IEEE Transactions on Neural Networks and Learning Systems20172811): 2541-2554. [百度学术] 

50

STANKOVI S SSTIPANOVI D MILJAK D D. Decentralized dynamic output feedback for robust stabilization of a class of nonlinear interconnected systems[J]. Automatica200743861-867. [百度学术] 

51

ZUO ZhiqiangZHANG JunWANG Yiling. Adaptive fault-tolerant tracking control for linear and Lipschitz nonlinear multi-agent systems[J]. IEEE Transaction on Industrial Electronics2015626): 3923-3931. [百度学术] 

52

SHI JiantaoZHOU DonghuaYANG Yuntaoet al. A fault-tolerant multivehicle formation control framework with applications in multi-quadrotor systems[J]. Science China-information Sciences20186112): 1-3. [百度学术] 

53

ZHANG KeJIANG BinSHI Peng. Adjustable parameter-based distributed fault estimation observer design for multi-agent systems with directed graphs[J]. IEEE Transactions on Cybernetics2017472): 306-314. [百度学术] 

54

SHEN QikunJIANG BinSHI Penget al. Cooperative adaptive fuzzy tracking control for networked unknown nonlinear multi-agent systems with time-varying actuator faults[J]. IEEE Transactions on Fuzzy Systems2014223): 494-504. [百度学术] 

55

ZHANG XiaodongPARISINI TPOLYCARPOU M M. Adaptive fault-tolerant control of nonlinear uncertain systems: An information-based diagnostic approach[J]. IEEE Transactions on Automatic Control2004498): 1259-1274. [百度学术] 

56

XU Jin. Fault-tolerant iterative learning control for mobile robots non-repetitive trajectory tracking with output constraints[J]. Automatica20189463-71. [百度学术] 

57

PANAGI PPOLYCARPOU M M. Distributed fault accommodation for a class of interconnected nonlinear systems with partial communication[J]. IEEE Transactions on Automatic Control20115612): 2962-2967. [百度学术] 

58

JIN XiaozhengYANG Guanghong. Distributed adaptive robust tracking and model matching control with actuator faults and interconnection failures[J]. International Journal of Control, Automation and Systems200975): 702-710. [百度学术] 

59

YANG HaoJIANG BinSTAROSWIECKI Met al. Fault recoverability and fault-tolerant control for a class of interconnected nonlinear systems[J]. Automatica20155449-55. [百度学术] 

60

YANG HaoZHANG ChenchengAN Zixinet al. Exponential small-gain theorem and fault-tolerant safe control of interconnected nonlinear systems[J]. Automatica2020115108866. [百度学术] 

61

DENG ChaoYANG Guanghong. Distributed adaptive fault-tolerant control approach to cooperative output regulation for linear multi-agent systems[J]. Automatica201910362-68. [百度学术] 

62

YU ZiquanZANG YoumingJIANG Binet al. Fractional order PID-based adaptive fault-tolerant cooperative control of networked unmanned aerial vehicles against actuator faults and wind effects with hardware-in-the-loop experimental validation[J]. Control Engineering Practice2021114104861. [百度学术] 

63

KAZEROONI E SKHORASANI K. Team consensus for a network of unmanned vehicles in presence of actuator faults[J]. IEEE Transactions on Control System Technology2010185): 11551161. [百度学术] 

64

YANG HaoSTAROSWIECKI MJIANG Binet al. Fault-tolerant cooperative control for a class of nonlinear multi-agent systems[J]. Systems & Control Letters2011604): 271-277. [百度学术] 

65

SABOORI IKHORASANI K. Actuator fault accommodation strategy for a team of multi-agent systems subject to switching topology[J]. Automatica201562200-207. [百度学术] 

66

AZIZI S MKHORASANI K. Cooperative actuator fault accommodation in formation flight of unmanned vehicles using relative measurements[J]. International Journal of Control2011845): 876-894. [百度学术] 

67

AZIZI S MKHORASANI K. A hierarchical architecture for cooperative actuator fault estimation and accommodation of formation flying satellites in deep space[J]. IEEE Transactions on Aerospace and Electronic Systems2012482): 1428-1450. [百度学术] 

68

TOUSI M MKHORASANI K. Optimal hybrid fault recovery in a team of unmanned aerial vehicles[J]. Automatica2012482): 410-418. [百度学术] 

69

ORGRETTIM E OHUEBSCH W WNARRAMORE Jet al. Investigation of relative humidity and induced-vortex effects on aircraft icing[J]. Journal of aircraft2007446): 1805-1814. [百度学术] 

70

LAMPTON AVALASEK J. Prediction of icing effects on the lateral/directional stability and control of light airplanes[J]. Aerospace Science and Technology2012231): 305-311. [百度学术] 

71

XU YuhangJIANG BinYANG Hao. Two-level game-based distributed optimal fault-tolerant control for nonlinear interconnected systems[J]. IEEE Transactions on Neural Networks and Learning Systems20203111): 4892-4906. [百度学术] 

72

XU YuhangYANG HaoJIANG Binet al. Distributed optimal fault estimation and fault-tolerant control for interconnected systems: A Stackelberg differential graphical game approach[J]. IEEE Transactions on Automatic Control2022672): 926-933. [百度学术] 

73

BASAT TOLSDER G J. Dynamic noncooperative game theory[M]. Philadelphia, USASociety for Industrial and Applied Mathematics1999. [百度学术] 

74

JIAO QiangMODARES HXU Shengyuanet al. Multi-agent zero-sum differential graphical games for disturbance rejection in distributed control[J]. Automatica2016692434. [百度学术] 

75

SUN JingliangLIU ChunshengYE Qing. Robust differential game guidance laws design for uncertain interceptor-target engagement via adaptive dynamic programming[J]. International Journal of Control2017905): 990-1004. [百度学术] 

76

SAHOO ANARAYANAN VJAGANNATHAN S. A min-max approach to event- and self-triggered sampling and regulation of linear systems[J]. IEEE Transactions on Industrial Electronics2019667): 5433-5440. [百度学术] 

77

HUANG YunhanCHEN JuntaoHUANG Linanet al. Dynamic games for secure and resilient control system design[J]. National Science Review2020717): 1125-1141. [百度学术] 

78

JAGAT ASINCLAIR A J. Nonlinear control for spacecraft pursuit-evasion game using the state-dependent Riccati equation method[J]. IEEE Transactions on Aerospace and Electronic Systems2017536): 3032-3042. [百度学术] 

79

MAHARJAN SZHU QZHANG Yet al. Dependable demand response management in the smart grid: A Stackelberg game approach[J]. IEEE Transactions on Smart Grid201341): 120-132. [百度学术] 

80

MOO N JBASAR T. Linear quadratic mean field Stackelberg differential games[J]. Automatica201897200-213. [百度学术] 

81

FOLEY MSCHMITENDORF W. A class of differential games with two pursuers versus one evader[J]. IEEE Transactions on Automatic Control1974193): 239-243. [百度学术] 

82

LIN WeiQU ZhihuaSIMAAN M A. Nash strategies for pursuit-evasion differential games involving limited observations[J]. IEEE Transactions on Aerospace and Electronic Systems2015512): 1347- 1356. [百度学术] 

83

LOPEZ V GLEWIS F LWAN Yet al. Solutions for multi-agent pursuit-evasion games on communication graphs: Finite-time capture and asymptotic behaviors[J]. IEEE Transactions on Automatic Control2020655): 1911-1923. [百度学术] 

84

CHEN JieZHA WenzhongPENG Zhihonget al. Multi-player pursuit-evasion games with one superior evader[J]. Automatica20167124-32. [百度学术] 

85

LIANG LDENG FLU Met al. Analysis of role switch for cooperative target defense differential game[J]. IEEE Transactions on Automatic Control2021662): 902-909. [百度学术] 

86

XU JuanjuanZHANG HuanshuiCHAI Tianyou. Necessary and sufficient condition for two-player Stackelberg strategy[J]. IEEE Transactions on Automatic Control2015605): 1356-1361. [百度学术] 

87

YUANG YuanZHANG PengLI Xuelong. Synchronous fault-tolerant near-optimal control for discrete-time nonlinear PE game[J]. IEEE Transactions on Neural Networks and Learning Systems20213210): 4432-4444. [百度学术] 

88

ZHANG BohanLu Shaobo. Fault-tolerant control for four-wheel independent actuated electric vehicle using feedback linearization and cooperative game theory[J]. Control Engineering Practice2020101104510. [百度学术] 

89

ZHANG BohanLU ShaoboWU Wenjuanet al. Robust fault-tolerant control for four-wheel individually actuated electric vehicle considering driver steering characteristics[J]. Journal of the Franklin Institute202135811): 5883-5908. [百度学术] 

90

CAO Ming. Merging game theory and control theory in the era of AI and autonomy[J]. National Science Review202077): 1122-1124. [百度学术] 

91

LI SisiLI NanGIRARD Aet al. Decision making in dynamic and interactive environments based on cognitive hierarchy theory, Bayesian inference, and predictive control[C]//Proceedings of IEEE 58th Conference on Decision and Control. Nice, FranceIEEE20192181-2187. [百度学术] 

92

KANELLOPOULOS AVAMVOUDAKIS K G. Non-equilibrium dynamic games and cyber-physical security: A cognitive hierarchy approach[J]. Systems & Control Letters201912559-66. [百度学术] 

93

YILDIZ AOZGULER A B. Foraging motion of swarms with leaders as Nash equilibria[J]. Automatica201673163-168. [百度学术] 

94

SUNDARAM SHADJICOSTIS C N. Distributed function calculation via linear iterative strategies in the presence of malicious agents[J]. IEEE Transactions on Automatic Control2011567): 1495-1508. [百度学术] 

95

XU YuhangYANG HaoJIANG Binet al. Multi-player pursuit-evasion differential games with malicious pursuers[J]. IEEE Transactions on Automatic Control2022. DOI: 10.1109/TAC.2022.3168430. [百度学术] 

96

YUAN C. YLIU Z XZHANG Y M. Learning-based smoke detection for unmanned aerial vehicles applied to forest fire surveillance[J]. Journal of Intelligent & Robotic Systems2019931): 337-349. [百度学术] 

97

NIGAM NBIENIAWSKI SKROO Iet al. Control of multiple UAVs for persistent surveillance: Algorithm and flight test results[J]. IEEE Transactions on Control Systems Technology2011205): 1236-1251. [百度学术] 

98

XING NaZONG QunDOU Linqianget al. A game theoretic approach for mobility prediction clustering in unmanned aerial vehicle networks[J]. IEEE Transactions on Vehicular Technology20196810): 9963-9973. [百度学术] 

99

LUAN HeyuXU YitaoLiu Dianxiong. Energy efficient task cooperation for multi-UAV networks: A coalition formation game approach[J]. IEEE Access20208149372-149384. [百度学术] 

100

SAAD WHAN ZBASAR Tet al. Hedonic coalition formation for distributed task allocation among wireless agents[J]. IEEE Transactions on Mobile Computing2011109): 1327-1344. [百度学术] 

101

CHEN JiaxinWU QihuiXU Yuhua. Joint task assignment and spectrum allocation in heterogeneous UAV communication networks: A coalition formation game-theoretic approach[J]. IEEE Transactions on Wireless Communications2020201): 440-452. [百度学术] 

102

JANG ISHIN H STSOURDOS A A. Hedonic game for task allocation in a large-scale multiple agent system[J]. IEEE Transactions on Robotics2018346): 1534-1548. [百度学术] 

103

KAZEROONI P BGHOSE D. Self assessment-based decision making for multi-agent cooperative search[J]. IEEE Transactions on Automation Science and Engineering201184): 705-719. [百度学术] 

104

MYLVAGANAM TSASSANO MASTOLFI A. Constructive epsilon-Nash equilibria for nonzero-sum differential games[J]. IEEE Transactions on Automatic Control2014604): 950-965. [百度学术] 

105

CAPPELLO DGARCIN SMAO Zet al. A hybrid controller for multi-agent collision avoidance via a differential game formulation[J]. IEEE Transactions on Control Systems Technology2020294): 1750-1757. [百度学术] 

106

SANJAB ASAAD WBASAE T. A game of drones: Cyber-physical security of time-critical UAV applications with cumulative prospect theory perceptions and valuations[J]. IEEE Transactions on Communications20206811): 6990-7006. [百度学术] 

107

GU Dubing. A differential game approach to formation control[J]. IEEE Transactions on Control Systems Technology2007161): 85-93. [百度学术] 

108

LIN WeiLI ChaoyongQU Zhihuaet al. Distributed formation control with open-loop Nash strategy[J]. Automatica2019106266-273. [百度学术] 

109

薛磊王庆领孙长银. 博弈论框架下的二阶多智能体系统领导者选择算法[J]. 控制理论与应 用20163312): 1593-1602. [百度学术] 

XUE LeiWANG QinglingSUN Changyin. Leader selection algorithm of the second-order multi-agent system under the framework of game theory[J]. Control Theory and Application20163312): 1593-1602. [百度学术] 

110

XUE LeiCAO Xianghui. Leader selection via supermodular game for formation control in multi-agent systems[J]. IEEE Transactions on Neural Networks and Learning Systems20193012): 3656-3664. [百度学术] 

111

LI JiaqingCHEN SaiLI Chaoyonget al. Distributed game strategy for formation flying of multiple spacecraft with disturbance rejection[J]. IEEE Transactions on Aerospace and Electronic Systems2020571): 119-128. [百度学术] 

112

茹常剑魏瑞轩戴静. 基于纳什议价的无人机编队自主重构控制方法[J].自动化学报2013398): 1349-1359. [百度学术] 

RU ChangjianWEI RuixuanDAI Jing. Autonomous reconfiguration control method of UAV formation based on Nash bargaining[J]. IEEE/CAA Journal of Automatica Sinica2013398): 1349-1359. [百度学术] 

113

KAZEROONI E SKHORASANI K. Multi-agent team cooperation: A game theory approach[J]. Automatica20094510): 2205-2213. [百度学术] 

您是第位访问者
网站版权 © 南京航空航天大学学报
技术支持:北京勤云科技发展有限公司
请使用 Firefox、Chrome、IE10、IE11、360极速模式、搜狗极速模式、QQ极速模式等浏览器,其他浏览器不建议使用!