摘要
混合采样数据不仅仅具有不同采样频率数据之间特征集合不同,还有样本数量不一致等特点,传统的分类方法不能直接使用。因此,本文提出一种基于Fisher判别准则字典学习的混合采样数据分类方法以处理采样数据的分类任务。该模型巧妙借助处理多视图数据的分类思想,利用基于Fisher判别准则的字典学习方法,生成的结构化字典的每个原子与数据的类标签相关,同时采用Fisher判别准则使类内散度更小,类间散度更大来约束编码系数矩阵,从而大大提升分类性能。此外,本文针对混合采样数据的样本数量不一致特点,设计了混合采样数据判别分析模型的分类方案。最后实验结果验证了本文方法的有效性。
大数据时代已经来临,随着各种数据采集设备(如红外线摄像机和网络摄像机)或是不同的媒介(如文本、视频和音频)的出现和发展,数据的来源、形式越来越多样
受多视图数据特点的启发,我们认为混合采样数据与多视图数据之间有一定的对应关系。混合采样数据的多个采样频率数据、不同采样频率下的不同特征集合就对应着多视图数据的多个视图数据、不同视图下的不同特征集合。因此,本文欲借鉴处理多视图数据的思想或方法,来解决混合采样数据分类问题。
多视图学习的重点是揭示不同视图的多个异构数据表的相关
混合采样数据分类任务的重点是探索不同采样频率数据的相关性,极大限度地利用原始数据进行学习。因此,本文欲借鉴多视图字典学习方法,提出一种基于字典学习的混合采样数据分类方法,旨在学习多个采样频率数据的判别子字典,和以Fisher判别准则约束的更具判别信息的编码系数矩阵,以提升模型的分类性能。
给定数据样本,,字典学习的目标任务是寻找字典,,以及对应的系数矩阵,,使得每个数据样本能更好地被字典重构,即,。字典学习解决以下优化问题
(1) |
显然式(1)的第1项是希望由系数矩阵能很好地重构数据样本,第2项则是希望系数矩阵尽量稀疏,可以使用KSVD算
Fisher判别字典学习(Fisher discrimination dictionary learning, FDDL)旨在学习一个结构化字典,是每个类簇的字典,是样本的总类簇数。给定训练样本,是第类训练样本,定义是样本矩阵在字典上的编码系数矩阵,,是第类训练样本在字典上的编码。FDDL的目标函数形式为
(2) |
FDDL目标函数的第1项是1个保真项,除了要求字典能重构第类训练样本,还要子字典也能很好地重构,且其他子字典不能重构。
(3) |
第3项类内散度和类间散度是为了约束编码系数矩阵,和分别是编码系数矩阵和的均值向量,表示第类训练样本的样本数量。
给定个视图数据,不相关多视图判别字典学习(Uncorrelated multi‑view discrimination dictionary learning, UM
(4) |
式中:第1项是1个判别保真项,,要求字典有能力重构。是样本的总类簇数,是的第类训练样本,是的第类子字典,定义为样本在字典上的编码系数矩阵,定义为样本在字典上的编码系数矩阵。表示不同视图间字典和的不相关约束,有。和分别表示字典和字典的原子数。表示了(字典的第个字典原子)和(字典的第个字典原子)的相关性,和分别代表两个原子的均值。
本节将多视图分类的思想融入混合采样数据分类模型中,首先系统地总结了混合采样数据分类模型的基本框架,然后分别描述了目标函数的判别保真项和判别系数项,随后给出了模型的目标函数,最后提出了混合采样数据分类方案。

图1 混合采样数据分类模型
Fig.1 Classification model for mixed sampling data
假设训练数据有个采样频率数据,定义为。对于第个采样频率数据,表示第类训练样本,和分别表示与第类和第类相关的类簇子字典。若定义为在字典上的编码系数矩阵,有,且表示为样本在子字典上的编码系数矩阵,,表示样本的类簇数。
目标函数的判别保真项应该遵循以下3个原则:(1)对于第个采样频率数据,字典应该具备重构样本的能力,于是应该使误差项最小化。(2)与第类相关的子字典应该具备重构样本的能力,于是应该使误差项最小化。(3)与第类相关的其他类子字典不应具备重构样本的能力,所以应该使最小化,从而使第类子字典对样本重构所占比重最大。判别保真项定义为
(5) |
为了提升模型的分类性能,使字典更具判别性,可以借助Fisher判别准则约束编码系数矩阵,最小化编码系数矩阵的类内散度,最大化类间散度,其定义如下
(6) |
式中:和分别表示第个采样频率数据第类编码系数矩阵和的均值向量,是样本的样本数量。判别系数项要求类内散度最小化,类间散度最大化,很显然,如果直接定义为,则是一个非凸且不稳定的函数,所以在判别系数项后增加一个弹性项使其满足凸优化条件,文献[
(7) |
当混合采样数据对应各采样频率数据的类簇子字典学习完成后,模型进入分类阶段。在文献[
(9) |
式中: 是样本在字典上的编码向量。定义,对应样本在字典上的编码向量。当测试样本对不同采样频率数据上字典进行的编码系数向量产生,将其应用到如下分类方案中,对给定测试样本,样本对每个类的重构误差计算为
(10) |
(11) |
式(10)第1项为样本由第个类簇子字典重构的误差项,第2项为编码系数向量与训练系数均值向量的距离。最后根据式(11)判断测试样本属于哪一类。
混合采样数据分类模型的目标函数中的变量可以在一个迭代过程中交替优化,可以使用以下优化策略进行每次迭代:(1)当更新第个采样频率数据对应的变量时,其他采样频率数据的对应变量固定。(2)对于第个采样频率数据,和交替更新。
假设固定,编码系数矩阵,在遍历每个类计算时,是固定的,目标函数式(8)可以简化为
(12) |
且有,其中和是两个均值向量矩阵(以个或为列向量组成)。文献[
算法1 混合采样数据系数矩阵更新算法
输入:和,,
输出:
① 初始化:系数矩阵,迭代次数。
② 判断目标函数是否收敛或达到最大迭代次数,否则执行第3步,是执行第5步。
③ 增加迭代次数。
④ 更新编码系数矩阵
其中:为在处的导数,是一个软阈值因子公式。
⑤ 输出编码系数矩阵,算法结束。
当编码系数矩阵更新完,不同采样频率数据的子字典逐类更新。在更新时,所有固定,因此式(8)可以简化为
(13) |
式(13)可以先将矩阵优化问题转换成向量优化按列更新字典,具体可以参见文献[
算法2 混合采样数据分类优化算法
输入:混合采样数据,标签
输出:字典矩阵和
① 用PCA方法初始化每个采样频率数据对应子字典
② 判断目标函数是否收敛或达到最大迭代次数,否则执行第3步,是执行第5步。
③ 固定字典矩阵,对每个采样频率数据用算法1逐类更新编码系数矩阵
④ 固定编码系数矩阵,对每个采样频率数据用MFL算
⑤ 输出字典矩阵和,算法结束。
本文算法采用Python语言并在Python 3.5解释器上进行实现,所有实验都在内存为8 GB RAM,CPU频率为2.70 GHz计算机上运行。为了便于实验,在UCI的一些真实多视图数据集上验证了本文提出的方法,
Data set | Object | Dimension | View | Cluster |
---|---|---|---|---|
WebKB | 187 | {187,187,187} | 3 | 5 |
SensIT | 300 | {50, 50} | 2 | 3 |
Digit | 2 000 | {76, 64, 47} | 3 | 10 |
Cora | 2 708 | {1 433, 2 708} | 2 | 7 |
Citeseer | 3 312 | {3 703, 3 312} | 2 | 6 |
WebKB数据集(http://membres‑lig.imag.fr/grimal/data.html)包含了来自4个大学的网页信息,每个网页可以被内容和链接信息等4个视图描述。由于4个子数据集在内容上较为相似,选择Texas数据集上的3个视图进行实验。SensIT数据集(https://www.csie.ntu.edu.tw/∼cjlin/libsvmtools/datasets/multiclass.html)包含了用于划分3种车辆的2个传感器视图数据,每个传感器视图数据有50个特征集合。Digit数据集(https://archive.ics.uci.edu/ml/datasets.html)描述手写数字0到9的特征信息,有10个类,2 000个样本,6个视图,选择以下3个视图进行后续实验:76 维字符形状的Fourier系数特征,64维Karhunen‑Love系数特征和47维 Zernike moments特征。Cora数据集(http://membres‑lig.imag.fr/grimal/data.html)描述了2 708个科学出版物文档,选择包含1 433个词特征的文档视图和含2 708个特征的文档链接视图。Citeseer数据集(http://membres‑lig.imag.fr/grimal/data.html)描述了3 312个科学出版物文档,选择含3 703个词特征的文档视图和含3 312个特征的文档链接视图。
本节实验主要包含两个部分:(1)实验数据集的各个视图以统一采样频率获取,以SensIT为例,利用本文所提出的方法,对SensIT的两个视图进行字典学习后分类,与将两个视图数据进行拼接后运用KNN分类算法进行对比。由

图2 实验结果1
Fig.2 Experimental results 1
(2)实验在SensIT和Digit数据集上,对SensIT的每个视图数据划分200个样本作为训练集,100个样本作为测试集;Digit的每个视图数据划分1 500个样本为训练集,500个样本为测试集。再以不同程度的采样频率对数据的每个视图进行数据采样生成混合采样数据,与对混合采样数据进行均值或中位数填充后在改进的处理多个数据表的FDDL算法进行对比。由
Index | Data set | Object | Sampling rate/% | Proposed | Improved FDD |
---|---|---|---|---|---|
ACC | SensIT | 300 | {100, 50} | 0.63 | 0.46 |
{100, 40} | 0.64 | 0.57 | |||
Digit | 2 000 | {100, 80, 60} | 0.474 | 0.492 | |
{100, 70, 50} | 0.512 | 0.446 | |||
{100, 60, 40} | 0.554 | 0.488 | |||
F1‑score | SensIT | 300 | {100, 50} | 0.623 | 0.449 |
{100, 40} | 0.632 | 0.514 | |||
Digit | 2 000 | {100, 80, 60} | 0.498 | 0.511 | |
{100, 70, 50} | 0.535 | 0.453 | |||
{100, 60, 40} | 0.571 | 0.512 |
在实际生活中,数据的采集频率会因为数据采集成本代价不同而高低有别,而采集成本高代价大的数据数量有限但是又相对重要,如何极大限度的利用原始数据,将多个不同采样频率数据充分运用成为一个研究难点。因此,本文将混合采样数据特有的不同采样频率、含不同特征集合的数据特点与多视图数据的多个视图、多个特征集合相类比,巧妙地借助多视图数据分类任务的思想,提出了一种基于字典学习的混合采样数据判别分析模型,该模型与多视图数据分类任务类似,但是又有其特有的混合采样频率的数据特点。本文方法在UCI的真实数据集上得到了验证,实验结果表明本文方法在处理混合采样数据分类问题具有一定的效果。但是该方法在目标函数的字典迭代更新过程中采用逐列更新,计算量较大,时间复杂度较高,还需要进一步完善,以便于更好地处理样本数和特征维数较大的混合采样数据分类问题。
参考文献
NAKAMURA E F, LOUREIRO A A F, FRERY A C. Information fusion for wireless sensor networks: Methods, models, and classifications[J]. ACM Com⁃puting Surveys (CSUR), 2007, 39(3): 9. [百度学术] [Google Scholar]
ARMESTO M T, ENGEMANN K M, OWYANG M T. Forecasting with mixed frequencies[J]. Federal Reserve Bank of St. Louis Review, 2010, 92(6): 521‑536. [百度学术] [Google Scholar]
ZHAO Jing, XIE Xijiong, XU Xin, et al. Multi‑view learning overview: Recent progress and new challenges[J]. Information Fusion, 2017, 38: 43‑54. [百度学术] [Google Scholar]
TOSIC I, FROSSARD P. Dictionary learning[J]. IEEE Signal Processing Magazine, 2011, 28(2): 27‑38. [百度学术] [Google Scholar]
ABDI A, RAHMATI M, EBADZADEH M M. Dictionary learning enhancement framework: Learning a non‑linear mapping model to enhance discriminative dictionary learning methods[J]. Neuroc⁃omputing, 2019, 357: 135‑150. [百度学术] [Google Scholar]
YANG Meng, ZHANG Lei, FENG Xiangchu, et al. Fisher discrimination dictionary learning for sparse representation[C]//International Conference on Computer Vision. N J: IEEE, 2011: 543‑550. [百度学术] [Google Scholar]
ZHUANG Yueting, WANG Yanfei, WU Fei, et al. Supervised coupled dictionary learning with group structures for multi‑modal retrieval[C]// Twenty⁃Seventh AAAI Conference on Artificial Intelligence. CA: AAAI, 2013: 1070‑1076. [百度学术] [Google Scholar]
GANGEH M J, FEWZEE P, GHODSI A, et al. Multiview supervised dictionary learning in speech emotion recognition[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2014, 22(6): 1056‑1068. [百度学术] [Google Scholar]
JING Xiaoyuan, HU Ruimin, WU Fei, et al. Uncorrelated multi‑view discrimination dictionary learning for recognition[C]//Twenty‑Eighth AAAI Conference on Artificial Intelligence. CA: AAAI, 2014: 2787‑2795. [百度学术] [Google Scholar]
WU Fei, JING Xiaoyuan, YOU Xinge, et al. Multi‑view low‑rank dictionary learning for image classification[J]. Pattern Recognition, 2016, 50: 143‑154. [百度学术] [Google Scholar]
WU Fei, JING Xiaoyuan, YUE Dong. Multi‑view discriminant dictionary learning via learning view‑specific and shared structured dictionaries for image classification[J]. Neural Processing Letters, 2017, 45(2): 649‑666. [百度学术] [Google Scholar]
WANG Qianyu, GUO Yanqing, WANG Jiujun, et al. Multi‑view analysis dictionary learning for image classification[J]. IEEE Access, 2018, 6: 20174‑20183. [百度学术] [Google Scholar]
WU Fei, DONG Xiwei, HAN Lu, et al. Multi‑view synthesis and analysis dictionaries learning for classification[J]. IEICE Transactions on Information and Systems, 2019, 102(3): 659‑662. [百度学术] [Google Scholar]
AHARON M, ELAD M, BRUCKSTEIN A. K‑SVD: An algorithm for designing overcomplete dictionaries for sparse representation[J]. IEEE Tran⁃sactions on Signal Processing, 2006, 54(11): 4311. [百度学术] [Google Scholar]
ENGAN K, AASE S O, HUSOY J H. Method of optimal directions for frame design[C]//International Conference on Acoustics, Speech, and Signal Processing. N J: IEEE, 1999: 2443‑2446. [百度学术] [Google Scholar]
WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2): 210‑227. [百度学术] [Google Scholar]
ROSASCO L, VERRI A, SANTORO M, et al. Iterative projection methods for structured sparsity regularization:MIT‑CSAIL‑TR‑2009‑050, CBCL‑282[R]. [S.l]: MIT, 2009:18‑47. [百度学术] [Google Scholar]
YANG Meng, ZHANG Lei, YANG Jian, et al. Metaface learning for sparse representation based face recognition[C]//International Conference on Image Processing. N J: IEEE, 2010: 1601‑1604. [百度学术] [Google Scholar]