中文核心期刊
中国科技论文统计源期刊
国际刊号:1005-2615
国内刊号:32-1429/V
用户登录
  E-mail:  
  密  码:  
  作者 审稿  
  编辑 读者  
期刊向导
联系方式ʽ
  • 主管:工业和信息化部
  • 主办:南京航空航天大学
  • 国际刊号:1005-2615
  • 国内刊号:32-1429/V
  • 地址:南京市御道街29号
  • 电话:025-84892726
  • 传真:025-84892726
  • E-mail:tnc01@nuaa.edu.cn
  • 邮编:210016
孙栓柱,陈广,高阳,孙彬,李逗,杨晨琛.基于相似度的半监督学习工业数据分类算法[J].南京航空航天大学学报,2021,53(5):677-683
基于相似度的半监督学习工业数据分类算法
Semi-supervised Learning Industrial Data Classification Algorithm Based on Similarity
投稿时间:2020-09-21  修订日期:2021-01-05
DOI:10.16356/j.1005-2615.2021.05.003
中文关键词:  数据分类  半监督学习  相似度  不平衡学习  不平衡数据分类
英文关键词:data classification  semi-supervised learning  similarity  unbalanced learning  unbalanced data classification
基金项目:江苏方天电力技术有限公司科技基金(KJ201919)资助项目。
作者单位邮编
孙栓柱 南京大学计算机科学与技术南京 210023
江苏方天电力技术有限公司南京 211102 
211102
陈广 南京大学计算机科学与技术南京 210023 210023
高阳 南京大学计算机科学与技术南京 210023 210023
孙彬 江苏方天电力技术有限公司南京 211102 211102
李逗 江苏方天电力技术有限公司南京 211102 211102
杨晨琛 江苏方天电力技术有限公司南京 211102 211102
摘要点击次数: 85
全文下载次数: 164
中文摘要:
      针对现实场景中大量无监督数据无法有效利用的特点,提出了一种基于数据相似度匹配的半监督学习算法。该方法结合一定的先验知识,通过无监督学习的方式,计算未标记数据与少量有标记数据之间相似度,从而对少数类样本进行扩充。利用构造后的数据集进行模型训练,从而提高模型对于少数类的识别效果。该方法能有效改进分类任务中数据分布不平衡及标记困难的问题,在一组基于真实场景下的电力传感器检测数据分类任务中取得了较好的少数类识别效果。通过对比传统以及半监督的多种分类算法,该方法虽然在准确率上低于传统方法,但是在召回率与F1值的表现上超越传统方法。
英文摘要:
      Despite their prior knowledge, a large amount of unsupervised industrial data cannot be effectively exploited in real-world applications regions. In this paper, we propose a semi-supervised learning algorithm based on similarity measurement. This method combines specific prior knowledge and unsupervised learning to calculate the similarity between unlabeled data and a small amount of labeled data to augment the minority samples. By improving the classification effect of the model on the minority class, we can mitigate sample imbalance in training phrases and marking difficulty. Empirically, a good minority recognition effect has been achieved in a series of power-sensor detection classification tasks. Compared with state-of-the-art methods, including the traditional and semi-supervised methods, the recall rate and the F1 value comprehensively exceed the traditional ones.
[HTML]  查看全文  查看/发表评论  下载PDF阅读器
关闭

Copyright @2010-2015《南京航空航天大学学报》编辑部

地址:南京市御道街29号        邮编:210016

电话:025-84892726      传真:025-84892726       E-mail:tnc01@nuaa.edu.cn

您是本站第3864834位访问者 本站今日一共被访问1771

技术支持:北京勤云科技发展有限公司

敬请关注《南航学报》官方微信