非结构化数据的多粒度集成分类方法
作者:
作者单位:

1.计算机软件新技术国家重点实验室(南京大学), 南京, 210023;2.南京大学计算机科学与技术系, 南京, 210023

作者简介:

通讯作者:

商琳,女,教授,E-mail:shanglin@nju.edu.cn。

中图分类号:

TP391

基金项目:

国家自然科学基金(61672276, 51975294)资助项目。


Multi-grained Ensemble Classification Method for Unstructured Data
Author:
Affiliation:

1.State Key Laboratory for Novel Software Technology (Nanjing University), Nanjing, 210023, China;2.Department of Computer Science and Technology, Nanjing University, Nanjing, 210023, China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    深度学习模型已经在文本和图像等分类任务上取得了不错的效果,然而深度学习模型很难为分类结果提供可解释性。本文提出一种非结构化数据的多粒度集成分类方法,与其他学习方法相比,多粒度集成分类方法能够保留数据的上下文信息。在多粒度集成分类方法中,数据被划分成不同的粒度,用于训练不同的基学习器,这些学习结果为集成模型最后的分类提供了可解释性。基学习器根据它们在验证集上的精度被赋予不同的权重,从而构造出一个较好的集成学习器。在实验中,本文验证了所提出模型在3种非结构化数据类型(文本、医学图像和时间序列)上的有效性。实验结果表明, 本文的模型比现有的基准方法简单,具有较好的分类精度,并且能够为数据的分类提供可解释性。

    Abstract:

    Deep learning model has achieved great success in text and image classification tasks. However, it is difficult for a deep learning model to provide an interpretable classification intuition. In this paper, we propose a multi-grained ensemble classification method for unstructured data. Compared with other learning methods, our multi-grained ensemble classification method can preserve the context information of data. In the multi-grained ensemble classification method, data are divided into different granularity, and the data with different granularity are used to train different base learners. Their learning results provide interpretability for the final classification of the ensemble model. Base learners are assigned by different weights according to their performances on the validation set, therefore, a better ensemble learner can be constructed. In the experiments, we verify the validity of our model on three types of unstructured data (i.e., text, medical images, and time series), and experimental results show that our model is not only simpler than the state of art but also competitive in the accuracy. Meanwhile, it can provide the interpretability for the final classification results.

    参考文献
    相似文献
    引证文献
引用本文

王子一,徐苏平,商琳.非结构化数据的多粒度集成分类方法[J].南京航空航天大学学报,2020,52(5):723-728

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2019-09-01
  • 最后修改日期:2020-02-10
  • 录用日期:
  • 在线发布日期: 2020-11-12
  • 出版日期:
您是第位访问者
南京航空航天大学学报 ® 2024 版权所有
技术支持:北京勤云科技发展有限公司