10.3969/j.issn.2095-2783.2012.07.001
基于 MapReduce 的模体发现算法
模体发现对于基因发现和理解基因调控关系有着重要的意义,它是生物信息学中最具挑战性的问题之一.提出了针对PMSP算法的3种数据划分方法,并在此基础上提出了基于MapReduce的模体发现算法(PMSPMR).针对不同难度的问题,在Hadoop集群上的实验结果表明,PMSPMR算法具有良好的可扩展性.特别地,对于难度较大的模体发现问题实例,PMSPMR算法的加速比接近于Hadoop集群中节点的数目.此外,对于真实数据的实验,PMSPMR算法能够识别出真核细胞和酿酒酵母中已知的转录调控模体,表明了算法的有效性
模体发现、数据划分、可扩展性
TP301.6(计算技术、计算机技术)
2012-09-24(万方平台首次上网日期,不代表论文的发表时间)
共8页
487-494