基于BERT的航天术语标准化
CSTR:
作者:
作者单位:

中国航天标准化研究所,北京 100071

作者简介:

通讯作者:

刘栋梁,男,工程师,E-mail:907644846@qq.com。

中图分类号:

基金项目:


Standardization of Aerospace Terms Based on BERT
Author:
Affiliation:

China Aerospace Standardization Institute, Beijing 100071,China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    将航天术语标准化问题与深度学习相结合,发挥深度学习在文本建模上强大的语义表征能力,提出了一种基于BERT的航天术语标准化方法。首先,介绍了自然语言处理任务中的文本相似度计算方法和序列标准方法。然后,针对一定量的航天文本原词数据,使用Jaccard相似度计算得到候选标准词。最后,通过构建BERT的预训练模型获得预测标准词。实验结果表明,BERT在自然语言处理任务上具有强大优势,基于多个术语标准评测数据集上准确率达到89.93%,可以提高航天术语标准化水平和效果。

    Abstract:

    Combining the aerospace terminology standardization with deep learning, and exerting the powerful semantic representation ability of deep learning in text modeling, we propose a BERT based aerospace terminology standardization method. First, the text similarity calculation method and the sequence standard method for natural language processing tasks are introduced. Second, for a certain amount of space text original word data, the candidate standard words are obtained by using Jaccard similarity calculation. Finally, the prediction standard words are obtained by constructing the pre-training model of BERT. The experimental results show that BERT has strong advantages in natural language processing tasks, and the accuracy rate on the evaluation data set based on multiple terminology standards reaches 89.93%. The proposed method can improve the standardization level and effect of aerospace terms.

    参考文献
    相似文献
    引证文献
引用本文

刘栋梁,张嵩,张宁康,高洋,林海波.基于BERT的航天术语标准化[J].南京航空航天大学学报,2022,54(S):109-114

复制
分享
相关视频

文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-05-15
  • 最后修改日期:2022-06-30
  • 录用日期:
  • 在线发布日期: 2022-11-02
  • 出版日期:
文章二维码
您是第位访问者
网站版权 © 南京航空航天大学学报
技术支持:北京勤云科技发展有限公司