摘要
针对作战部队弹药调度策略问题,综合考虑不同作战部队对弹药调度时间因素和安全因素需求程度的差异,通过博弈模型对多目标问题进行度量,进而结合遗传算法对弹药调度策略进行优化。仿真结果表明,本文构建的博弈模型能够更加合理地为不同环境下具有差异化需求的弹药调度策略进行优化。
作战部队能够顺利完成任务的前提是需要有效并且可靠的弹药供应支持。从有效性方面来说,作战部队只有在正确的时间、正确的地点及时地接收充足的弹药,才能发挥最大的作战能力。从可靠性方面来说,在战争中弹药供应一直是敌方重点打击的战略目标,而且随着信息技术的应用与普及,越来越多的高精度侦察装备与远程打击武器被开发出来并装备部队,使得在战场上弹药供应面临越来越多的打击。因此,结合作战地区的交通运输条件和安全情况,对弹药的供应进行合理的调度,以最短的时间保证作战部队弹药的充足需求,是作战胜利的重要条件。
目前国内外学者对于弹药调度策略的研究主要集中在两个方面。(1)对弹药运输路径优化问题的算法进行了改进。例如,Dantzig
实际上,在战争环境中各作战部队对弹药的需求是有差异性的,战况紧急的部队对弹药供应的时间要求更高,而另外一些部队可能更加在意弹药的安全性。通过传统方法对不同目标进行度量往往结果具有主观性,不能够很好地适应不同的作战环境。因此,基于不同部队之间的利益冲突,博弈模型被用于多目标优化问题当中。Dhingra
基于以上论述,本文充分考虑弹药调度过程中的时间因素和安全因素,根据不同作战部队的差异化需求通过博弈模型更加合理地对其目标函数进行描述,并借助遗传算法进行问题求解。仿真实验分析了不同环境下的弹药调度问题,结果表明作战部队的差异化需求能够明显影响弹药的最优调度策略。
弹药调度策略优化模型是提供最终策略的重要参考依据,是弹药调度系统的核心。参与作战的每个弹药储存点的弹药调度量是多少,每个作战部队的弹药由哪些储存点进行调度,弹药通过什么样的运输路线送达作战部队,这些问题都是弹药调度策略优化模型所需要解决的。具体来说,在作战部队确定了弹药需求量的情况下,弹药调度策略优化模型的总体目标是以尽量短的时间和尽可能安全的方式将作战所需的弹药从储存点送达作战部队,即在保证每个作战部队需求得到最大满足的前提下尽量使调度的时间最少。基于以上分析,本文对弹药供应的调度策略主要依据时间因素和安全因素进行优化,具体的优化目标包括:
(1)快速满足作战需求。弹药如何能快速送到作战部队对于战争的胜负至关重要。弹药的运输是影响弹药送达时间的关键因素,合理的弹药调度策略会减少弹药运输过程中的等待时间和不必要的中转环节,并且有利于运输车辆的来回运转,从而提高作战保障能力。
(2)符合调度安全要求。弹药安全送达同样是决定战争胜负的重要条件。如果安全性得不到保障,那么弹药需求就不能及时实现。因此,弹药调度策略一定要以考虑安全性为前提。
假如表示作战区域内的弹药储存点,每个存储点的弹药数量充足从而可以满足任意调度策略的需求;表示作战区域内的作战部队;dj表示作战部队所需要的弹药数量;表示战争时期内作战部队的作战程度的级别,作战级别较高的部队对于弹药的需求更加迫切;表示弹药储存点到作战部队的距离;表示不考虑交通状况时弹药运输通过路段的速度;表示路段的道路容量,不同等级的道路容量不同,因而通行能力也不同;表示路段的交通流量,衡量车辆的多少;表示弹药从储存点运送到作战部队的时间。
对于弹药调度策略的优化,需要确定一个最优的弹药调度方案,即确定每个弹药储存点对每个作战部队进行供应的弹药数量,使得弹药调度结果满足作战部队需求的条件。假如弹药调度策略表示为
(1) |
则必须满足约束条件,该约束条件保证了各作战部队的需求都能得到满足。
从时间因素方面来说,对于正常的路段,如果不考虑交通状况,则弹药运输通过该路段的时间为, 如果考虑交通拥堵的路段,根据美国联邦公路局路阻函数模型,可以估计弹药运输通过该路段的时间为
(2) |
式中:为固定参数,参考王
(3) |
从安全性的角度来说,一方面,道路容量等级较高的路段通行能力较强,因此受到敌方攻击的概率也随之增加,弹药的损失程度较为严重;另一方面,弹药的运输时间越长遭受攻击的概率也会增加,造成弹药损失。参考任
(4) |
式中:表示标准化的,是固定参数,用于运输时间对敌方攻击情况的影响。表示弹药安全送到作战部队的可能性,越大则安全性越高。
根据以上分析得到弹药调度策略模型的优化目标为
(5) |
式中:表示弹药的调度策略,其中。很明显可以看出,优化目标和之间既有一致性同时也有冲突性。优化目标为了达到最小值,需要通过具有较大容量的道路进行弹药调度,从而满足时间最少。而对于优化目标来说,尽管时间最少的目标符合一定程度的安全性要求,但是通过具有较大容量的道路进行弹药调度也使得弹药被敌方攻击的损耗程度增加。因此在时间上两者具有一致性,但是在道路容量上两者具有冲突。为了解决具有利益冲突的多目标优化问题,本文将通过合作竞争博弈模型对其进行求解。
博弈论适合解决存在利益冲突的问题,可以分析博弈方各自的策略为自身带来的利益以及对整体利益之间的影响。博弈模型通常由3部分组成:博弈方、博弈方的策略集以及根据博弈方式构造的收益函数。假如博弈模型有个影响因素需要进行设计,可以定义如下目标函数
(6) |
式中:表示设计变量结合。为各博弈方所拥有的策略空间集合,并且满足条件且,其中。设计目标,,,可以看作个博弈方。目标问题的个目标函数可以看作对应博弈方所得收益,其约束条件即博弈过程中可选策略的约束条件。
将目标问题转化为博弈问题的关键技术在于将设计变量集合分割为各博弈方拥有的策略集。策略集的分解一般包含两个部分:首先设计变量集对各博弈方的影响因子矩阵用于形成分类样本,然后对该矩阵模糊聚类,从而可以求出各博弈方所具有的策略空间。具体过程如下:
(1)分别对个目标进行单目标优化,得到各目标函数的单目标优化值,其中。
(2)对任意的设计变量,将其定义域按步长等分为段,则设计变量对第个博弈方的影响因子可以表示为
(7) |
(3)定义第个分类样品为,其中的含义是第个设计变量对所有个目标函数的影响因子集合。可以表示全部分类样品的集合。本文采用欧式距离来刻画样品之间的相似程度,则和的相似度可以通过欧式距离进行表示
(8) |
根据相似度可以建立相似度矩阵
(9) |
(4)对相似度矩阵进行模糊聚类,进而得到的分类结果,由于和各元素是相互对应的,因此的聚类结果即的聚类结果。根据聚类结果,设计变量集合被分解为个策略集。进一步计算所含设计变量分别对所有目标函数的影响因子之和,各博弈方根据影响因子之和的大小选取对应的策略集。
博弈论可以分为合作博弈与竞争博弈。由于目标函数之间既可以存在合作关系,也可以存在竞争关系,因此本文分别比较了不同博弈行为时优化目标的区别,旨在为弹药调度策略的优化提供一定的参考。
在合作博弈模型中,策略集合是基于整体最优进行考虑得到的结果,因此得到的博弈结果是一个Praeto前沿弱有效解。换句话说,对任意博弈方,是在给定其余博弈方的策略组合情况下该博弈方所做出的最优策略,该结果对于博弈整体来说是最优的,但是不能保证对每个博弈方都是最优结果,该结果不会使博弈个体的效用变差,且不存在另一个策略集合使所有博弈方的支付函数都变优,即对任意都成立。据此建立合作博弈模型的收益函数为
(10) |
式中:为博弈方执行博弈策略时自身的收益;表示策略集为时第个目标函数的值;为单目标优化时的最优值,即最小值;为单目标优化时的最差值,即目标函数的最大值。
在竞争博弈模型中,各博弈方通过竞争方式争取自身收益最大化,因此其收益函数就等于各自的目标函数,即
(11) |
竞争博弈可以得到满足各博弈方收益的纳什均衡解,尽管纳什均衡所得到的不一定为收益,但在竞争博弈中是最稳定的。
对于既有合作行为又有竞争行为的博弈模型,对目标函数进行模糊聚类之后,根据聚类结果和影响因子的大小将目标函数进行分类,相同类别的目标函数之间为合作博弈,不同类别目标函数之间为竞争博弈。
针对不同的博弈模型,在对目标函数进行分类之后,分别确定收益函数并通过遗传算法对目标问题进行求解。
假设在作战区域内有5个弹药储存点以及10个供应的部队。每个作战部队的弹药需求量在内随机生成,储存点的弹药储备充足且能够满足所有弹药调度策略,结果见
部队编号 | 1 | 2 | 3 | 4 | 5 | 6 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|
弹药需求 | 8 | 5 | 4 | 6 | 2 | 6 | 6 | 7 | 8 |
基于以上作战环境,本文将通过合作竞争博弈模型给出每个作战部队需求都能得到满足的最优弹药调度策略。通过遗传算法求出每个作战部队针对每个目标函数所得到的最优调度策略。由于目标函数是求最小值,因此本文以其倒数作为适应度函数,从而适应度的最大值即目标函数的最小值。遗传算法的最优适应度演化过程均以最优适应度的形式进行表示,结果分别如

图1 目标函数适应度演化
Fig.1 Fitness evolution of target function

图2 目标函数适应度演化图
Fig.2 Fitness evolution of target function
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
1 | 4.17 | 0.08 | 0.05 | 1.05 | 0.28 | 1.65 | 0.37 | 2.11 | 0.38 | 2.86 |
2 | 2.00 | 0.79 | 1.54 | 2.02 | 0.56 | 1.20 | 0.22 | 0.13 | 2.17 | 0.23 |
3 | 0.03 | 0.33 | 1.41 | 0.25 | 0.53 | 1.82 | 0.64 | 1.16 | 1.92 | 0.37 |
4 | 0.43 | 2.00 | 0.28 | 1.24 | 0.55 | 0.31 | 0.34 | 1.94 | 1.46 | 2.62 |
5 | 1.37 | 1.79 | 0.72 | 1.44 | 0.08 | 1.02 | 0.43 | 0.65 | 1.06 | 1.92 |
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
1 | 2.70 | 1.32 | 0.41 | 1.48 | 0.48 | 1.28 | 0.58 | 1.66 | 0.35 | 1.12 |
2 | 2.05 | 0.79 | 1.56 | 1.50 | 0.51 | 1.71 | 0.03 | 0.59 | 0.73 | 2.09 |
3 | 0.75 | 1.23 | 0.52 | 0.68 | 0.10 | 0.36 | 0.55 | 1.87 | 2.72 | 1.64 |
4 | 1.68 | 1.23 | 0.23 | 1.59 | 0.52 | 1.42 | 0.49 | 0.42 | 0.09 | 2.45 |
5 | 0.81 | 0.43 | 1.29 | 0.75 | 0.38 | 1.23 | 0.36 | 1.44 | 3.10 | 0.70 |
将本文的目标函数和分别作为博弈双方,通过影响因子和模糊聚类对博弈双方的策略集进行划分,得到结果为隶属于目标函数,而隶属于。根据策略集的划分结果,可以定义博弈模型的收益函数。由于本文进行博弈的目标函数只有两种,因此两者之间的博弈关系只能是合作博弈或者竞争博弈。另外,由于本文目标函数和分别求最小值和最大值,为了方便计算,本文将博弈方的收益函数定义为原函数的倒数。因此,针对合作博弈模型定义收益函数如下
式中:和分别为函数单目标优化的最优值和最差值;,分别为函数单目标优化的最优值和最差值。通过遗传算法求得上述目标函数的最小值,其结果即合作博弈情况下的最优弹药调度策略,具体结果见
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
1 | 1.19 | 1.08 | 0.85 | 1.21 | 0.10 | 0.96 | 0.38 | 2.38 | 1.29 | 2.64 |
2 | 2.98 | 0.15 | 0.89 | 0.00 | 0.50 | 0.23 | 0.44 | 1.46 | 0.47 | 0.95 |
3 | 1.15 | 0.31 | 1.03 | 1.56 | 0.61 | 1.46 | 0.09 | 1.72 | 1.94 | 0.71 |
4 | 2.19 | 0.33 | 0.87 | 1.61 | 0.65 | 1.81 | 0.01 | 0.12 | 1.13 | 2.96 |
5 | 0.49 | 3.13 | 0.36 | 1.61 | 0.15 | 1.54 | 1.09 | 0.32 | 2.17 | 0.74 |
针对竞争博弈模型的求解,由于本文已对策略集进行模糊聚类,即从聚类分析的角度来说,目标函数完全由决定,而目标函数只与变量有关。因此,以在下的单目标优化最优值为已知量,对目标函数在变量集范围内进行单目标优化,得到的结果即除了以外其他变量的最优调度方案。同样方法,仅以为变量对目标函数进行单目标优化,得到的结果即的最优调度方案。以上方案的并集即所有作战部队的最优弹药调度最优方案,具体结果见
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
1 | 0.19 | 1.25 | 0.02 | 1.31 | 0.55 | 0.89 | 0.00 | 1.79 | 0.41 | 2.80 |
2 | 0.34 | 1.32 | 0.97 | 0.61 | 0.15 | 0.26 | 0.07 | 0.92 | 1.82 | 0.28 |
3 | 2.20 | 0.05 | 1.24 | 1.43 | 0.22 | 1.45 | 1.88 | 0.37 | 2.16 | 1.04 |
4 | 3.77 | 0.79 | 0.65 | 1.35 | 0.60 | 1.72 | 0.03 | 1.41 | 0.36 | 2.75 |
5 | 1.50 | 1.59 | 1.12 | 1.29 | 0.48 | 1.69 | 0.01 | 1.50 | 2.25 | 1.12 |
通过对比合作博弈和竞争博弈得到的结果可以看出,有的作战部队调度方案非常类似,但也有作战部队调度方案差别较大,说明在不同环境下作战部队弹药调度方案是有明显区别的。因此在实际弹药供给过程中,需要根据具体作战环境,衡量各博弈方信息和决策是否协商,进而确定合适的模型进行弹药最优调度方案的设计。
本文针对作战部队弹药调度策略问题,综合考虑不同作战部队对弹药调度时间因素和安全因素需求程度的差异,通过多目标设计的方法对弹药调度策略进行优化。不同作战部队之间对于弹药的需求存在明显的利益冲突,而作为调度决策的制定者不仅需要满足所有作战部队的弹药需求,还要从全局的角度尽可能优化整体收益。因此,本文通过引入博弈论的方法针对不同作战部队对不同影响因素的需求进行区分和度量,分别以合作博弈模型、竞争博弈模型和合作竞争博弈模型刻画不同的博弈环境,对弹药调度策略进行优化,既满足了时间因素和安全因素的要求,同时也考虑了博弈方之间的决策协商情况。仿真结果表明,相同的弹药需求通过不同模型得到的调度方案具有较大的差别,说明博弈方在信息和决策方面的共享协商能够明显影响弹药调度策略,而本文构建的博弈模型能够更加合理地为不同环境下具有差异化需求的弹药调度策略进行优化。
参考文献
DANTZIG G B, RAMSER J H. The truck dispatching problem[J]. Management Science, 1959, 6(1): 80⁃91. [百度学术] [Google Scholar]
MIRABI M, GHOMI S M T F, JOLAI F. Efficient stochastic hybrid heuristics for the multi‑depot vehicle routing problem[J]. Robotics and Computer⁃Integrated Manufacturing, 2010, 26(6): 564⁃569. [百度学术] [Google Scholar]
周生伟, 蒋同海, 张荣辉. 改进遗传算法求解VRP问题[J]. 计算机仿真, 2013, 30(12): 140⁃143. [百度学术] [Google Scholar]
ZHOU Shengwei,JIANG Tonghai,ZHANG Ronghui. Improved genetic algorithm for VRP[J].Computer Simulation, 2013, 30(12): 140⁃143. [百度学术] [Google Scholar]
张群, 颜瑞. 基于改进模糊遗传算法的混合车辆路径问题[J]. 中国管理科学, 2012, 20(2): 121⁃128. [百度学术] [Google Scholar]
ZHANG Qun,YAN Rui. Hybrid vehicle routing problem based on improved fuzzy genetic algorithm[J]. Chinese Journal of Management Science,2012, 20(2): 121⁃128. [百度学术] [Google Scholar]
SEBBAH S, GHANMI A, BOUKHTOUTA A. A column⁃and⁃cut generation algorithm for planning of Canadian armed forces tactical logistics distribution[J]. Computers & Operations Research, 2013, 40(12): 3069⁃3079. [百度学术] [Google Scholar]
童晓进, 符卓, 刘勇, 等. 连续消耗应急物资调运问题研究[J]. 铁道科学与工程学报, 2013, 10(5): 78⁃82. [百度学术] [Google Scholar]
TONG Xiaojin, FU Zhuo, LIU Yong, et al. Study of emergency material dispatch for the continuous consumption[J].Journal of Railway Science and Engineering, 2013, 10(5): 78⁃82. [百度学术] [Google Scholar]
王坤, 刘金梅. 弹药运输路径最优选择模型的仿真研究[J]. 计算机仿真, 2017,34(5): 21⁃24. [百度学术] [Google Scholar]
WANG Kun,LIU jinmei. Ammunition to ensure optimal path selection model simulation research[J]. Computer Simulation, 2017,34(5): 21⁃24. [百度学术] [Google Scholar]
佟常青, 王景国, 陈博文. 军队应急物资配送备选路径优化多目标规划模型研究[J]. 物流技术, 2010, 29(S1): 206⁃208. [百度学术] [Google Scholar]
TONG Changqing,WANG Jingguo,CHEN Bowen. A multi‑objective programming model of routing optimization for milltary emergency material distribution[J].Logistics Technology, 2010, 29(S1): 206‑208. [百度学术] [Google Scholar]
王梓行, 姜大立, 杨李, 等. 战时导弹火力打击任务分配与运输决策模型[J]. 后勤工程学院学报, 2017,33(4): 77⁃85. [百度学术] [Google Scholar]
WANG Zihang,JIANG Dali,YANG Li,et al. Task allocation and transportation decision model of missile fire strike in wartime[J].Journal of Logistical Engineering University, 2017,33(4): 77‑85. [百度学术] [Google Scholar]
李磊, 杨西龙, 汪贻生, 等. 基于Multi⁃agent的军事虚拟物流业务协同控制模型[J]. 自动化与仪器仪表, 2014(4):128⁃130+134. [百度学术] [Google Scholar]
LI Lei,YANG Xilong,WANG Yisheng,et al. Military logistics business based on multi‑agent virtual collaborative control model[J].Automation & Instrumentation, 2014(4): 128‑130,134. [百度学术] [Google Scholar]
韩震,卢昱,古平,等.战时弹药供应协同调运模型研究[J].军械工程学院学报,2014,26(5):1⁃4. [百度学术] [Google Scholar]
HAN Zhen,LU Yu,GU Ping,et al. Coordinated allocation and transportation model for wartime ammunition supply[J]. Journal of Ordnance Engineering College, 2014,26(5): 1‑4. [百度学术] [Google Scholar]
姜大立, 张巍. 基于混合编码遗传算法的战时军事物流调运协同优化问题研究[J]. 军事运筹与系统工程, 2018, 32(1): 44⁃51. [百度学术] [Google Scholar]
JIANG Dali,ZHANG Wei. A study on coordination optimization of military logistics in wartime based on hybrid coding genetic algorithm[J]. Military Operations Research and Systems Engineering, 2018,32(1): 44‑51. [百度学术] [Google Scholar]
DHINGRA A K, RAO S S. A cooperative fuzzy game theoretic approach to multiple objective design optimization[J]. European Journal of Operational Research, 1995, 83(3): 547⁃567. [百度学术] [Google Scholar]
RANGANATHAN N, GUPTA U, SHETTY R, et al. An automated decision support system based on game theoretic optimization for emergency management in urban environments[J]. Journal of Homeland Security and Emergency Management, 2007, 4(2): 1547‑1554. [百度学术] [Google Scholar]
SONG C Z, YOUQUN Z, LU W. Tri⁃objective co⁃evolutionary algorithm and application of suspension parameter design based on lizard behavior bionics[J]. Journal of Mechanical Science and Technology, 2014, 28(12): 4857⁃4867. [百度学术] [Google Scholar]
谢能刚, 岑豫皖, 孙林松, 等. 基于混合行为博弈的多目标仿生设计方法[J]. 力学学报, 2008, 40(2):229⁃237. [百度学术] [Google Scholar]
XIE Nenggang,CEN Yuwan,SUN Linsong,et al. Multl‑objective bionics design method based on mixed‑behavior game[J]. Chinese Journal of Theoretical and Applied Mechanics,2008, 40(2): 229⁃237. [百度学术] [Google Scholar]
冯嘉珍, 张建国, 邱继伟. 模拟动物行为的多目标可靠性优化设计博弈算法[J]. 北京理工大学学报, 2018, 38(5): 449⁃453. [百度学术] [Google Scholar]
FENG Jiazhen,ZHANG Jianguo, QIU Jiwei. Game algorithm of multi‑objective reliability design optimization based on simulating animal behavior[J].Transactions of Beijing Institute of Technology, 2018, 38(5): 449‑453. [百度学术] [Google Scholar]
叶文海, 陈亮, 李廖平. Isight在博弈多目标优化中的应用[J]. 福州大学学报(自然科学版), 2017, 45(3): 391⁃397. [百度学术] [Google Scholar]
YE Wenhai,CHEN Liang, LI Liaoping. The application of Isight in multi‑objective optimization with game[J]. Journal of Fuzhou University(Natural Science Edition), 2017, 45(3): 391‑397. [百度学术] [Google Scholar]
王炜. 交通规划[M]. 北京:人民交通出版社,2008. [百度学术] [Google Scholar]
任骥. 战场后勤物资供应与补给中心选址优化问题研究[D]. 长沙:国防科学技术大学, 2014. [百度学术] [Google Scholar]
REN Ji. Distribution network design in battlefield environment with loss consideration[D].Changsha: National University of Defense Technology,2014. [百度学术] [Google Scholar]