学位专题

目录>
<

基于Trie树的字符串检索算法研究

屈晓芳
中国计量大学
引用
近年来,随着互联网技术的快速发展和智能移动设备的普及,网络上的数据资源正成指数级增长,对于人们来说如何在这些海量信息中进行有效存储、检索成为数据管理领域一个亟待解决的问题。首先,字符串检索必须能够尽量用最少的空间存储越来越多的字符串数据,这些字符串集合往往包含了几百万甚至上千万的信息,而且还在不断增长。其次,字符串检索还要考虑查找信息的时间效率,能否用最快的速度找到需要的信息是用户对各类信息检索算法性能优劣的重要评判标准。因此为字符串资源研究出一种新型的存储结构、索引算法就变得很有意义。本文的主要工作如下:  1、对Trie树算法的研究现状、性能评判指标进行了概述。对传统的字符串检索算法和检索字符串的原理进行了描述,提出了基于Trie树的字符串检索算法和改进时空性能的方案。  2、根据性能优化策略,完成了可用来检索字符串信息的新Trie树结构的构造,即16-bitTrie树。本文采用软件VisualC++6.0对16-bitTrie树算法进行编码,实现了对字符串数据的存储、检索、删除等功能。  3、编码实现原始Trie树结构、VC++的标准库Stdmap,将他们与本文提出的16-bitTrie树算法进行时间和空间性能比较。通过实验数据分析,证明了本文提出的16-bitTrie树算法在对字符串数据进行检索时,能在保持时间复杂度的前提下,减少信息存储的内存空间,实现较高的构建速度和索引速度。  本文提出的基于16-bitTrie树的字符串检索算法具有空间效率高,可以随时对字符串数据进行修改、遍历等特点,很好的解决了Trie树结构的时间和空间平衡问题。

字符串检索;Trie树;压缩感知;时空性能

中国计量大学

硕士

控制工程

肖英;张宇

2019

中文

TP391.3

2020-04-16(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅