学位专题

目录>
<
DOI:10.7666/d.y658955

生物信息学中的序列比对算法研究

唐玉荣
中国农业大学
引用
序列比对是生物信息学中一种基本的信息处理方法,对于发现核酸和蛋白质序列上的功能、结构和进化的信息具有非常重要的意义.随着生物序列数据库中序列数据的激增,开发兼有高度生物敏感性和高效率的算法就显得非常迫切.该文研究了生物信息学中的双序列和多序列比对算法,主要研究内容和取得的成果如下:1.在经典的Ukkonen快速序列比对算法基础上,借鉴FA算法(Fast Alignment Algorithm)在计算得分矩阵时记录元素来源关系的存储方法,运用在矩阵中寻找Checkpoint点的Checkpoint技术,研究了一种基于动态规划思想的较为实用的全局双序列比对算法.2.根据目前双序列比对的研究现状,对几种经典的双序列比对算法进行了分析介绍,并且用C++语言编程实现了这些算法,为该文研究的基于动态规划的双序列比对算法创造了对比实验条件.3.基于多序列比对研究现状的分析,提出一种基于遗传算法的多序列比对解决方法,设计并实现了序列比对问题的遗传编码,初始群体生成方式,适应度函数计算以及选择、交叉和变异三种重要遗传操作的方式.4.针对遗传算法容易陷入局部最优解的缺点,提出模拟退火算法与遗传算法相结合的思想,在遗传操作中加入退火操作,可明显提高多序列比对进化后期的收敛速度.5.CLUSTAL程序是生物学界通用的多序列比对软件之一,随着同时进行比对的序列数据量的增加,其时间复杂度急剧增加,该程序无法满足大规模的序列数据比对.为进一步优化算法的运行时间,设计了基于Windows操作系统的、单机多处理器的CLUSTAL并行算法,并对CLUSTAL程序中的两两快速比对的核心算法进行了代码优化.6.CLUSTAL程序的指导树构建采用Neighbor-joining邻位相连算法,该算法同时也是很多指导树生成专用软件的核心算法.针对其在指导树生成方面存在近似程度不高的问题,运用寻找主结点的思想,设计了Neighbor-joining的改进算法.7.以该文提出的序列比对算法为基础,设计并实现了一个基于Windows操作系统的中文序列比对系统及应用平台.其功能主要包括序列文件管理、序列比对算法选择、参数设置、比对结果输出和指导树查看等.该文的研究内容是生物信息中序列比对的改进与创新算法,经过实际测试,其生物敏感性和运算效率较之传统算法均有所提高,在此算法基础上开发的系统平台软件可以为生物信息学的研究及实践提供一定支持.

双序列比对;多序列比对;生物信息学

中国农业大学

博士

农业电气化与自动化

汪懋华

2004

中文

Q811.4

85

2005-07-14(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅