10.3969/j.issn.1000-386x.2018.05.018
一种基于Spark的分布式时态索引方法
基于Spark分布式计算平台提出一种分布式时态索引方法.该方法提出时态数据集的分段索引构造策略,对每一分段设计基于Spark的时态索引构建方法及基于Spark RDD的并行查询策略;根据时态查询所涉及的Spark RDD分区模式的不同,将其分为分区独立查询,跨区查询以及跨段查询,并分别针对不同模式的时态查询提出优化的辅助索引结构,提高查询效率;在基准数据上进行实验,验证了所提索引策略的实用性和高效性,同时表明所提方法对数据规模的有效自扩展性以及降低了集群硬件配置需求.
时态数据、时态索引、Spark、分布式、分段存储
35
TP391(计算技术、计算机技术)
上海市科技创新行动计划16JC1400802
2018-06-20(万方平台首次上网日期,不代表论文的发表时间)
共8页
102-108,163