2021, 53(5):653-663. DOI: 10.16356/j.1005-2615.2021.05.001
摘要:元强化学习是指自动从一组相关任务中学习强化学习所需归纳偏置的相关理论和方法,对于提高强化学习算法在困难场景下的样本效率和泛化能力具有重要用途。本文提出一种新的元强化学习框架,指出设计和分析一个元强化学习算法需要同时考虑学习经验(相关任务)、归纳偏置及学习目标3个独立因素及这3个因素之间的依赖关系。在此基础上对该领域的研究现状进行了分析和总结,特别对近年来元强化学习若干文献进行了分析和归类,并详细阐述了几种代表性算法的原理及各自特点。本文还对元强化学习常用的实验环境和性能评价方法进行了介绍,对该领域的不足和未来的发展方向进行了讨论和分析。
2021, 53(5):664-676. DOI: 10.16356/j.1005-2615.2021.05.002
摘要:大数据处理是近年来广受关注和研究的技术领域,数据挖掘作为从大量数据中挖掘隐藏价值信息的技术,是处理大数据的有效工具。本文主要从数据挖掘的角度对大数据处理算法的研究现状进行分类总结。首先介绍了大数据中针对流式数据分类的方法,包括单模型算法和集成分类算法;其次分别从单机算法和基于分布式并行平台的多机算法两个角度概括介绍了大数据聚类方法以及大数据关联规则挖掘方法;最后总结了现有面向大数据的数据挖掘算法的研究进展并展望未来的发展趋势。
2021, 53(5):677-683. DOI: 10.16356/j.1005-2615.2021.05.003
摘要:针对现实场景中大量无监督数据无法有效利用的特点,提出了一种基于数据相似度匹配的半监督学习算法。该方法结合一定的先验知识,通过无监督学习的方式,计算未标记数据与少量有标记数据之间相似度,从而对少数类样本进行扩充。利用构造后的数据集进行模型训练,从而提高模型对于少数类的识别效果。该方法能有效改进分类任务中数据分布不平衡及标记困难的问题,在一组基于真实场景下的电力传感器检测数据分类任务中取得了较好的少数类识别效果。通过对比传统以及半监督的多种分类算法,该方法虽然在准确率上低于传统方法,但是在召回率与F1值的表现上超越传统方法。
2021, 53(5):684-691. DOI: 10.16356/j.1005-2615.2021.05.004
摘要:互联网应用的普及使得多模态数据快速增长,跨模态检索技术已成为相关领域的关键技术之一。针对现有跨模态哈希算法存在的网络结构和量化方法等方面的问题,本文在新的深度跨模态哈希检索模型之上,提出了一种基于K-means的深度跨模态哈希量化优化方法(K-means-based quantitative-optimization for deep cross-modal hashing,KQDH)。该方法通过K-means聚类算法对多模态数据特征向量分类,并通过集体量化方式来控制量化误差,使得哈希码更好地表示出多模态特征。实验结果表明,该方法能在多模态数据之间保持相似性并最大程度地捕获语义信息,从而提高跨模态检索的准确性和效率。
2021, 53(5):692-699. DOI: 10.16356/j.1005-2615.2021.05.005
摘要:局部保持投影(Locality preserving projection, LPP)在特征提取中得到了广泛的应用。但是,LPP不使用数据的类别信息,并且采用
2021, 53(5):700-707. DOI: 10.16356/j.1005-2615.2021.05.006
摘要:传统的聚类算法一般只适用于静态数据的处理,而真实世界的数据往往数据量大且变化多,静态的聚类算法不能为动态数据提供其演化规律的分析学习。演化数据的聚类,一方面要正确反映每一时刻数据的合理簇划分,另一方面又要使动态的聚类结果在演化过程中尽可能平滑。本文提出了一种自适应时间平滑的演化聚类框架,该模型考虑到当前时刻数据与历史时刻数据的未知关联,通过限定时间回溯的范围,自适应地寻找与当前快照最相关的历史快照,并通过有机融合基于Itakura-Saito距离的静态相似度和基于时间序列的动态相似度,计算各个时间片快照上的相似度矩阵。本文进一步提出了两种自适应时间平滑的演化谱聚类算法,从不同的角度定义时间代价,得到不同的演化聚类结果。在真实数据集上的实验表明这两种算法能够有效地利用历史数据,在聚类结果上准确性更高,时间平滑性也更好。
2021, 53(5):708-717. DOI: 10.16356/j.1005-2615.2021.05.007
摘要:提出一种基于改进极限学习机(Online sequence extreme learning machine, OSELM)的新能源电站数据采集与监控(Supervisory control and data acquisition, SCADA)系统攻击检测模型。首先使用ADASYN算法对数据样本中的异常数据和正常数据进行数量平衡,以满足真实电站SCADA系统环境中异常数据量少的特点。接着使用降噪自编码网络对平衡后的数据进行约简,消除无关或冗余特征以降低检测模型的训练时间。最后在AWID数据集上进行了大量对比实验,结果表明,所提的数据约简方法可有效地降低数据维度,降低了检测时间;与其他基于浅层学习算法的检测分类器相比,本文所提方法在检测准确度和误报率方面也体现出了更优性能。
2021, 53(5):718-725. DOI: 10.16356/j.1005-2615.2021.05.008
摘要:基于自编码器的特征提取技术广泛应用于图像聚类分析,在较简单的图像集上取得了令人满意的聚类结果,但自编码器的特征表示能力有限,很难捕捉到复杂低质图像的局部特征。本文提出一种基于非对称结构卷积自编码器(Convolutional auto-encoder with an asymmetric structure, ASCAE)的学习视觉特征的深度聚类方法,其中非对称结构的卷积自编码器用于学习特征表示,然后使用K-means算法对特征数据进行聚类分析。为进一步提高特征表示能力,ASCAE方法的网络采用变步长的卷积层和全连接的重构误差正则约束网络的重构误差。在7个公开图像集上的实验结果表明该网络有很好的特征表示能力,并且使得K-means算法能提供很好的聚类结果。在COIL-20和MNIST图像集上,聚类方法ASCAE的聚类精度分别为0.754和0.918,优于同类型的4种深度聚类方法(AEC、IEC、DEC和DEN)。
2021, 53(5):726-734. DOI: 10.16356/j.1005-2615.2021.05.009
摘要:传统先进陶瓷零件检测与分类的主流方法为纯机械尺寸过滤和人工判断,为解决其成本高、失误率高和损坏率高等问题,提出了基于深度学习的多目标实时检测分类模型(Multi-object real-time detection and classification model, MRDC)。该模型以YOLOv3为基础,使用SKNet作为注意力机制进行特征重构提高精确度,配合灰度图快速转化算法与跳帧检测方法提高检测速度,可实现实时缺陷检测。对实际生产中的先进陶瓷零件进行采集训练,多批次采集图像数据,每批数据含多个陶瓷零件的1 000张图像,平均精确率均值达到99.19%,用先进陶瓷零件生产线视频检验,识别分类的正确率达到100%,可以保证每分钟检测450~550个零件。多目标实时检测分类模型拥有识别速度更快、识别准确率更高和零件不易损坏等优点,可极大地节约生产原料与人力成本,减少废品产出。
2021, 53(5):735-742. DOI: 10.16356/j.1005-2615.2021.05.010
摘要:针对传统的入侵检测方法在未知攻击上表现不佳、且没有考虑信息不足的情况对于决策的影响的问题,本文提出了一种基于三支决策和数据增广的入侵检测算法CGAN-3WD。算法利用条件生成对抗网络来满足三支决策理论对数据信息的需求。首先基于三支决策理论对网络行为做出决策,将网络行为划分至正域、负域以及边界域中;之后基于条件生成对抗神经网络来完成数据增广,生成新的样本数据,从而为分类器提供更多的信息以支撑分类器将边界域转化为正域或者负域。NSL-KDD数据集被用于本文的实验中,实验证明,本文提出的算法CGAN-3WD在对入侵行为的检测上要优于对比的方法,能够有效地检测出入侵行为。
2021, 53(5):743-750. DOI: 10.16356/j.1005-2615.2021.05.011
摘要:由于光照变化、相机抖动和动态背景等因素影响,现有基于传统图像处理方法的前景提取算法并不能在复杂场景下获得良好的分割效果。针对此类问题,本文提出了一种基于全卷积孪生神经网络的前景提取算法,仅需任意2帧图像即可准确提取运动前景。将输入的2帧图像分为背景图像与待提取图像,将其输入全卷积孪生神经网络得到二者的相似性度量图,该相似性度量图中包含待提取图像相对于背景图像的各像素变化情况信息;接着将相似性度量图与待提取图像融合,利用编解码网络以实现端到端的前景提取。在CDnet2014数据集上进行综合评估与测试,结果均证明了该方法的有效性。
2021, 53(5):751-758. DOI: 10.16356/j.1005-2615.2021.05.012
摘要:在证件审核场景中,常规的深度学习人脸识别方法人证比对精度低且在嵌入式设备运行效率差。为解决上述问题,本文提出了改进的轻量级卷积神经网络Lightnet,并采用了迁移学习方法。Lightnet是结合深度可分离卷积、线性瓶颈结构和注意力模块构成的轻量级卷积神经网络模块,引入附加角度裕量的损失函数AM-Softmax监督训练后,网络模型能够保持较高的验证精度,并有效解决标准卷积神经网络参数冗余、计算量大的问题。迁移学习通过冻结预训练模型的卷积层权重,并在自制的人证数据集微调,提高了网络模型的人证场景的识别性能。实验结果表明,所设计的轻量级人证比对算法在验证精度、参数量以及运行效率等方面取得了很好的效果,且对生活场景有较好的鲁棒性。
2021, 53(5):759-765. DOI: 10.16356/j.1005-2615.2021.05.013
摘要:针对数字阵列雷达的空域搜索过程,提出了一种基于黎曼流形的波束驻留时间分配算法。为了补偿天线在扫描阵列侧面时,波束展宽造成的波束增益损耗,根据黎曼流行给出uv平面内波束驻留时间的空间分布,在满足指定距离上的单次检测概率和累积检测概率的条件下,实现波束驻留时间在整个空域的优化分配,最小化雷达系统总的搜索时间消耗。仿真结果表明,基于黎曼流行的波束驻留时间分配算法消除了波束扫描角变化导致波束增益变化带来的影响,实现了雷达在不同方向的等威力探测。
2021, 53(5):766-771. DOI: 10.16356/j.1005-2615.2021.05.014
摘要:深度强化学习在学习过程中需要与环境进行大量的交互,训练效率低下。模仿学习通过从专家示范中学习,可以有效地应对这一挑战,但是需要收集大量的专家示范轨迹,在复杂任务中往往导致高昂的示范代价。本文提出一种基于主动学习的行为克隆算法,通过主动挑选示范起始状态来减小示范代价。该方法基于不确定性采样和不相似性采样两种策略,从状态候选集中挑选最有价值的状态作为起始状态,然后向专家查询固定长度的示范轨迹,希望从尽可能少的示范中学习出有效策略。在多个不同任务上的实验表明,本文方法可以用更少的示范轨迹进行行为克隆,降低了强化学习中的专家示范代价。
2021, 53(5):772-779. DOI: 10.16356/j.1005-2615.2021.05.015
摘要:非负矩阵分解模型是一种常见的数据降维方法。在现有非负矩阵分解算法用于聚类的研究中,每个类别一般仅由一个或者指定多个中心点表示,然而这种表示方式往往无法准确描述其类别的特征和结构,从而影响聚类效果。为了解决这个问题,本文提出了峰值点非负矩阵分解算法。该算法首先为数据集找到多个密度峰值点,并构建密度峰值点和样本点的二部图,然后利用二部图完成聚类。此外该算法引入流形图正则化项来充分利用数据间的流形结构信息,并给出了算法的迭代更新规则。在大量真实数据集上的实验结果表明,该方法可以更加有效地利用数据本身的结构信息,从而提高聚类效果。
2021, 53(5):780-788. DOI: 10.16356/j.1005-2615.2021.05.016
摘要:视频行人重识别旨在不同摄像头拍摄的视频中检索特定行人。但是,它面临着数据量庞大和视频数据存在时间冗余的问题,即视频数据耗费大量的存储空间且不同帧之间存在极强的相关性。因此,使用所有的帧进行识别会带来查询效率的下降,而且视频中大量的干扰和噪声也会给准确率带来不利影响。本文提出了基于步行周期聚类的视频行人重识别关键帧提取算法,首先利用行人步行时双脚距离变化的周期性规律提取候选步行周期,然后利用聚类的方法从候选步行周期中选出关键步行周期作为关键帧。最后,将该算法应用在视频行人重识别中,仅使用关键帧的信息进行识别以减少时间冗余的影响,从而提高准确率,并且在查询前对视频进行处理,减少视频数据量以提高查询效率。在视频行人重识别数据集MARS和DukeMTMC-VideoReID上的实验表明,本文算法能够减少59%~82%的视频数据量,并且累积匹配曲线Rank-1提高了1.1%~1.4%,平均精度均值提高了0.2%~5%。
2021, 53(5):789-800. DOI: 10.16356/j.1005-2615.2021.05.017
摘要:针对混凝土类脆性材料高应变率下本构行为,结合ABAQUS有限元仿真与反向传播(Back propagation,BP)人工神经网络技术,对分离式霍普金森压杆(Split Hopkinson pressure bar,SHPB)实验过程中关键波形参数进行仿真和机器学习,建立了混凝土类材料SHPB高应变率下力学性能预测的机器学习模型,极大地提升了复杂脆性材料受冲击状态下变形行为与本构参数之间关联机制的计算效率。利用商业有限元软件ABAQUS的动态分析模块,通过在入射杆自由面设置4种不同的应力波,得到在不同应变率下材料应力-应变曲线,通过对比数值模拟结果和SHPB实验,验证了基于有限元分析的计算结果准确性。以20组ABAQUS仿真结果作为训练样本,其中入射波作为输入层,透射波和反射波作为输出层,建立相应的机器学习预测模型。研究结果表明:基于BP人工神经网络技术的机器学习预测模型具有良好的适用性,可代替量大且耗时的有限元仿真建模、分析及后处理流程,实现了高应变率下混凝土类材料应力-应变曲线形式本构行为的高效准确预测,同时可以预测给定训练样本以外更大应变率范围下材料应力-应变曲线。
2021, 53(5):801-812. DOI: 10.16356/j.1005-2615.2021.05.018
摘要:翼型动态失速是指机翼或叶片的当地迎角呈现周期或急剧变化时绕流附面层大范围分离带来的一种强烈的非线性、非定常流动现象。动态失速涡脱离翼型后缘流向下游时,会引发升力急剧下降、阻力迅速增大的失速和颤振问题。基于旋翼翼型两自由度动态试验装置和高频高速振荡试验装置,以典型旋翼翼型为研究对象,利用纳秒脉冲激励电源和介质阻挡放电等离子体激励器,在FL-11风洞和FL-20风洞开展了翼型动态失速等离子体流动控制试验研究,试验最高雷诺数突破1.7×106,模型最高振荡频率突破10 Hz。试验结果表明,等离子体气动激励能够有效控制翼型动态失速,改善平均气动力,减小俯仰力矩负峰值,减小气动力/力矩随迎角变化的迟滞区域。
2021, 53(5):813-820. DOI: 10.16356/j.1005-2615.2021.05.019
摘要:针对飞机零件几何模型多尺度特征检测问题,提出一种鲁棒的多尺度特征点检测算法。算法首先设计一种
2021, 53(5):821-826. DOI: 10.16356/j.1005-2615.2021.05.020
摘要:在高温干燥的氧气环境中,SiC材料将氧化生成SiO2氧化膜,影响材料性能。SiO2在SiC上的生长由氧气通过氧化物的扩散控制。由于温度条件限制,传统实验方法很难测定氧气在高温氧化物中的扩散。本文采用分子动力学研究不同温度下氧在熔融SiO2中的扩散行为。基于Morse、L-J等势函数及其参数,模拟了高温下的无定形SiO2结构,计算获得了氧在950、1 100、1 200、1 300及1 400 ℃温度下的均方位移曲线及扩散系数,分析了温度对气体扩散的影响作用,拟合了温度相关的Arrhenius公式。研究结果可为SiC基及其复合材料的氧化行为研究提供参考。