基于轨迹大数据时空分布的索引与查询方法
作者:
作者单位:

1.北方工业大学信息学院,北京 100144;2.大规模流数据集成与分析技术北京市重点实验室(北方工业大学),北京 100144

作者简介:

通讯作者:

赵卓峰,男,研究员,E-mail:edzhao@ncut.edu.cn。

中图分类号:

TP311

基金项目:

北京市自然科学基金(4202021)。


Index and Query Method Based on Spatial-Temporal Distribution of Trajectory Big Data
Author:
Affiliation:

1.School of Information,North China University of Technolgy,Beijing 100144,China;2.Beijing Key Laboratory on Integration and Analysis of Large-Scale Stream Data (North China University of Technolgy),Beijing 100144,China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    由于移动对象自身行为特征和整体规律的不同,使得其产生的轨迹数据具有较大的时空分布不均特点,从而影响轨迹数据索引和查询的效率。针对现有轨迹数据索引方法很少考虑轨迹数据分布不均特性的情况,提出了一种基于历史数据预分区的时空索引方法,其借助轨迹数据时空维度上分布的相似性,首先在空间上根据数据分布情况对Geohash编码进行预分区,进而建立轨迹数据的索引结构和基于HBase的存储模型,并利用该索引结构设计了基于Geohash分区的查询分解算法。基于真实出租车轨迹数据集的实验表明,相较于均匀划分的扩展的HGrid方法与混合编码的ST-hash方法,本文提出的索引结构及其查询方法可以有效提升海量具有不均匀特征轨迹数据的时空查询性能,并且可以在保证查询结果准确性的同时,最大限度地减少子查询的数量。

    Abstract:

    Due to the diversified behavioral characteristics and regular pattern of moving objects, the trajectory data generated by these objects shows obvious uneven distribution feature in time and space, which may lead to worse performance for trajectory data indexing and querying. However, the existing trajectory data indexing methods rarely consider this problem. In this paper, a temporal-spatial distribution based indexing and querying method is proposed. In the method, Geohash code is introduced and pre-partitioned spatially by utilizing the temporal-spatial similarity of the trajectory data distribution. Then, we use the pre-partitioned Geohash code, partition number and the trajectory data timestamp to compose the index structure. With this index structure, a storage model based on HBase and a query algorithm based on Geohash partition are designed respectively. The empirical study using real trajectory dataset shows that the method improves the spatiotemporal query performance of trajectory data by comparing with the Extend_HGrid and ST-hash methods, and effectively reduces the number of sub-queries during query.

    参考文献
    相似文献
    引证文献
引用本文

李征宇,赵卓峰.基于轨迹大数据时空分布的索引与查询方法[J].南京航空航天大学学报,2022,54(3):528-536

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-10-10
  • 最后修改日期:2022-01-23
  • 录用日期:
  • 在线发布日期: 2023-02-22
  • 出版日期:
您是第位访问者
南京航空航天大学学报 ® 2024 版权所有
技术支持:北京勤云科技发展有限公司