基于相似度的半监督学习工业数据分类算法
作者:
作者单位:

1.南京大学计算机科学与技术,南京 210023;2.江苏方天电力技术有限公司,南京 211102

作者简介:

通讯作者:

孙栓柱,男,教授级高级工程师,E-mail:15905166613@139.com。

中图分类号:

TP391

基金项目:

江苏方天电力技术有限公司科技基金(KJ201919)资助项目。


Semi-supervised Learning Industrial Data Classification Algorithm Based on Similarity
Author:
Affiliation:

1.Department of Computer Science and Technology, Nanjing University, Nanjing 210023, China;2.Jiangsu Frontier Electric Technology Co. Ltd., Nanjing 211102, China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对现实场景中大量无监督数据无法有效利用的特点,提出了一种基于数据相似度匹配的半监督学习算法。该方法结合一定的先验知识,通过无监督学习的方式,计算未标记数据与少量有标记数据之间相似度,从而对少数类样本进行扩充。利用构造后的数据集进行模型训练,从而提高模型对于少数类的识别效果。该方法能有效改进分类任务中数据分布不平衡及标记困难的问题,在一组基于真实场景下的电力传感器检测数据分类任务中取得了较好的少数类识别效果。通过对比传统以及半监督的多种分类算法,该方法虽然在准确率上低于传统方法,但是在召回率与F1值的表现上超越传统方法。

    Abstract:

    Despite their prior knowledge, a large amount of unsupervised industrial data cannot be effectively exploited in real-world applications regions. In this paper, we propose a semi-supervised learning algorithm based on similarity measurement. This method combines specific prior knowledge and unsupervised learning to calculate the similarity between unlabeled data and a small amount of labeled data to augment the minority samples. By improving the classification effect of the model on the minority class, we can mitigate sample imbalance in training phrases and marking difficulty. Empirically, a good minority recognition effect has been achieved in a series of power-sensor detection classification tasks. Compared with state-of-the-art methods, including the traditional and semi-supervised methods, the recall rate and the F1 value comprehensively exceed the traditional ones.

    参考文献
    相似文献
    引证文献
引用本文

孙栓柱,陈广,高阳,孙彬,李逗,杨晨琛.基于相似度的半监督学习工业数据分类算法[J].南京航空航天大学学报,2021,53(5):677-683

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-09-21
  • 最后修改日期:2021-01-05
  • 录用日期:
  • 在线发布日期: 2021-11-02
  • 出版日期:
您是第位访问者
南京航空航天大学学报 ® 2024 版权所有
技术支持:北京勤云科技发展有限公司