基于聚类的多标记选择性集成
作者:
作者单位:

1.河北师范大学计算机与网络空间安全学院,石家庄,050024;2.河北师范大学数学科学学院,石家庄,050024;3.河北师范大学数学博士后科研流动站,石家庄,050024

作者简介:

通讯作者:

李磊军,男,副教授,E-mail:lileijun1985@163. com。

中图分类号:

O236

基金项目:

国家自然科学基金(61502144, 62076088, 61672206)资助项目;河北省自然科学基金(F2018205196, F2019205295)资助项目;河北省高等学校自然科学基金(BJ2019014)资助项目;河北省博士后择优资助科研基金(B2016003013)资助项目;河北省三三三人才工程培养经费(A2017002112)资助项目。


Multi-label Selective Ensemble Based on Clustering
Author:
Affiliation:

1.College of Computer and Cyber Security, Hebei Normal University, Shijiazhuang,050024, China;2.College of Mathematics Science, Hebei Normal University, Shijiazhuang,050024, China;3.Postdoctoral Research Workstation of Mathematics, Hebei Normal University, Shijiazhuang,050024, China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    多标记学习和选择性集成是机器学习中的两个热点研究问题。本文利用聚类思想探究多标记学习中的选择性集成, 提出了两种具体的多标记选择性集成算法:基于最小距离的簇中心选择算法(Minimum distance based cluster center selection,MDCCS)和基于K-means的簇中心选择算法(K-means based cluster center selection, KMCCS)。在所提出的算法中,如何度量学习器之间的距离是其能否成功的关键因素。本文首先基于学习器的分类结果对其进行重新表示,在此基础上给出了学习器之间距离的计算方式。此外, 对于算法中的空簇问题给出了两种解决方法。基于Mulan数据库中的多标记数据集和5种评价指标对所提算法进行了详细的分析,实验结果表明了所提算法的有效性。

    Abstract:

    Multi-label learning and selective ensemble are two hotspot problems in machine learning. Selective ensemble is explored in multi-label learning based on clustering. Two multi-label selective ensemble algorithms, including minimum distance based cluster center selection (MDCCS) and K-means based cluster center selection(KMCCS), are proposed. The key is to measure the distance between base learners in the proposed algorithms. The learners are represented based on their classification results, then the distance between the learners can be calculated. Besides, two solutions are proposed to solve the problem of empty cluster in the algorithm. Based on the multi-label data sets in Mulan database and five evaluation indexes, the proposed algorithms are analyzed in detail. The experimental results show the effectiveness of the proposed algorithms.

    参考文献
    相似文献
    引证文献
引用本文

张佳欢,李磊军,李美争,米据生,解滨.基于聚类的多标记选择性集成[J].南京航空航天大学学报,2020,52(5):768-776

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-06-06
  • 最后修改日期:2020-07-11
  • 录用日期:
  • 在线发布日期: 2020-11-12
  • 出版日期:
您是第位访问者
网站版权 © 南京航空航天大学学报
技术支持:北京勤云科技发展有限公司