学位专题

<

DC-CLUSTER软件的设计与开发

李冯
上海大学
引用
随着人类基因组计划(HGP)的完成以及分子生物学等相关学科的发展,基因组学的研究重心从揭示生命的所有遗传信息转移到分子水平的功能研究上。后基因组学强调发展和应用整体的实验方法,分析基因组序列信息、阐明基因功能。其任务是进行基因组功能注释,了解基因的功能,认识基因与疾病的关系,掌握基因的产物及其在生命活动中的作用。生物信息学的研究重点也从基因组序列转移到序列的生物学意义的研究上。在后基因组时代,生物信息学主要研究基因组编码序列的转录、翻译的过程和结果,着重分析基因表达调控信息,分析基因及其产物的功能。随着功能基因组研究的深入,产生了海量的生物数据。如何有效地利用这些数据,研究基因的表达调控机制,研究基因在生物体代谢途径中的地位,分析基因、基因产物之间的相互作用关系,已经成为生物信息学在功能基因组学研究的重要任务。 生物信息学是处理生物分子信息、揭示生物分子信息内涵的一种技术,它在基因芯片研究与应用中起着重要的作用。从确定基因芯片检测对象到基因芯片设计,从芯片检测结果分析到实验数据管理和信息挖掘,无不需要生物信息学的支持和帮助。 生物信息学现有的许多方法都可以直接应用于基因芯片,如序列比较方法、片段组装方法、聚类方法等。然而,基因芯片研究与应用又对生物信息学提出了许多新的问题。数据挖掘问题就是其中之一。基因芯片所产生的数据相当多,并且与其他数据有关联,如何分析这些数据之间的关系、挖掘其中的知识,是一个十分重要的问题,而目前生物信息学中数据挖掘也是一个有待发展的研究方向。 目前,基因芯片的数据挖掘已成为生物信息学研究的热点之一,引起了广泛的重视。特别是高密度的DNA微阵列,由于其荷载了成千上万个DNA片段,可用于高通量的生物学检测,其开发和利用已进入商业化阶段,而其数据处理和数据挖掘更受关注。鉴于此,我们开发了一个处理和分析基因芯片数据的完全自动化的系统DC_CLLISTER。文中的第五章详细介绍了用C/C++语言编码的DC CLUSTER系统的总体设计流程,从软件系统结构、数据文件的格式、基因表达谱聚类分析、基本表达差异的显著性分析等几个方面对软件的设计和实现功能进行了详细阐述,着重介绍了聚类分析、基本表达差异的显著性分析所应用的相关算法和设计过程。并且用酵母基因芯片对系统的预测精度进行了检验,检验证明系统分析结果的正确性达到分析要求。因此它将是基因芯片研究中有用的辅助工具。

生物信息学;基因芯片;数据处理系统;软件开发;聚类分析

上海大学

硕士

系统分析与集成

王翼飞

2007

中文

TP311.52

80

2007-11-12(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅