10.3969/j.issn.1000-386x.2017.04.005
基于高通量测序的短序列生物数据压缩研究
高通量测序技术(NGS)的发展带来了测序数据量的极速增长,给数据的存储和传输带来了极大的压力.数据压缩技术是解决这个问题的重要方法.传统的压缩方法并没有很好地利用数据本身的特性.因此,计算机学者们关注于NGS测序数据专用的压缩方法.全面总结针对高通量测序技术产生的Fastq和Fasta数据的压缩算法,介绍了Fastq和Fasta数据的特点,总结了目前常用的压缩方法.并通过不同物种、不同测序平台、不同规模的测序数据对多个具有代表性的压缩工具进行测试,比较它们的压缩性能并且验证相应的工具特点,为研究人员提供工具选择指导或改善工具性能提供帮助.最后总结阐述短序列数据压缩工具存在的问题和发展趋势.
数据压缩、短序列数据压缩、高通量测序
34
TP391(计算技术、计算机技术)
2017-05-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
22-27,98