10.3969/j.issn.1000-386x.2016.01.006
一种提高海量电子健康档案存储性能的方法
医疗旅游是目前兴起的一个新型产业,面对今后日益增长的巨大数据,有效数据的存储和用户的快速访问是急需解决的课题.Hadoop的出现满足了这一需求.但Hadoop并不适合用来处理大量的小文件,其HDFS(Hadoop distributed file system)采用主从架构,存储大量的小文件时,元数据快速增加,NameNode内存被大量占用,读取性能也受到一定的影响,直接降低了整个系统的扩展性及效率.利用RDBMS和Hadoop的优势,提出一种改进的小文件存储优化方案,同时又根据电子健康档案数据的特点,提出按副本组进行数据传输存储的方案,并采用数据预取机制,提高访问效率.实验表明,该方法能有效提高电子健康档案中的小文件存储和读取的性能,一定程度上很好地解决了NameNode内存瓶颈问题.
Hadoop、HDFS、小文件、存储效率、数据预取
33
TP311(计算技术、计算机技术)
海南省教育厅自然科学类重点项目Hjkj2013-03
2016-04-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
21-23,41