学位专题

目录>
<

基于功能基因网络的杨树基因功能注释平台PoplarGene及其应用

刘琦
中国林业科学研究院
引用
林木为人们提供大量的生物质材料和能源,然而,林木的生长周期通常很长,且携带的基因组相对较大,使得在这些植物上直接进行分子生物学实验变得相对困难,杨树具有速生、容易扩繁、基因组相对较小、相对容易进行转基因研究等特征,成为木本植物研究的优良模式植物。此外,杨树在我国大部分国上均能种植,是现有人工林中适生范围最广和用途最广的林木,已成为我国人造板工业材和纸浆材的主要原料。深入了解杨树生物学过程能有效促进杨树育种与遗传改良。杨树(毛果杨)是林木中第一个被测序全基因组的物种,但是仍有大部分杨树基因缺乏功能注释,本研究构建杨树功能基因网络,并开发基于功能基因网络的杨树基因功能注释生物信息学平台,为杨树未知功能基因的功能注释提供重要信息,进一步基于杨树功能基因网络,使用开发的平台开展木材形成发育基因的生物信息学分析,为从系统层面了解木材形成提供参考。论文主要研究结果如下:  1.通过机器学习方法构建杨树功能基因网络。基于毛果杨基因组及已有的不同类型数据,通过多种算法挖掘杨树功能基因关联,共获得23种不同数据来源的杨树功能基因关联集合。基于构建的训练标准集,通过机器学习算法中贝叶斯框架对功能关联进行打分,并最终整合成一个综合的基因组范围的杨树功能基因网络PoplarNet。该网络包含1967631个功能关联,节点覆盖70%的毛果杨参考基因。准确率-召回率分析表明PoplarNet比任意通过单个数据集获得的功能基因网络具有更高覆盖度和准确度,且比通过同源映射法基于拟南芥和水稻功能基因网络的杨树功能基因网络具有更高准确性和覆盖度。功能基因网络的其中一个重要功能是被用来对未知表型相关基因进行预测,通过测试发现PoplarNet在反映已知通路与预测未知通路基因方面都表现较高水平。网络基本性质分析也表明PoplarNet服从生物学网络的特征,包括无标尺网络属性和明显的模块化构成,在包含的最大的子网络中,通过聚类分析检测到24个核心模块,这些模块在杨树生命活动可能参与了重要功能。  2.结合杨树功能基因网络PoplarNet和基因多角度的功能信息注释,构建杨树基因功能检索与分析的生物信息学平台PoplarGene。该平台提供直观且友好的界面,不仅提供基因功能注释信息的检索,还在其中开发多种基因分析功能,包括基于临近基因的基因排序、基于上下文的基因排序、木本植物功能基因网络同源映射、启动子顺式作用元件分析和基因集合功能富集分析功能,同时,PoplarGene平台还整合多种便利的生物信息学工具。PoplarGene可基于功能基因网络的功能关联来注释杨树未知功能的基因,显著提高注释基因的覆盖度,而且其基于网络的分析功能可用于鉴定性状相关的新候选基因。使用PoplarGene平台进行多种应用案例分析,包括(1)使用PoplarGene检索未知功能基因的功能信息,获得其多方面的功能信息注释;(2)基于临近基因的基因排序进行木质部细胞发育相关基因的相关性排序及新候选基因挖掘,使用基于上下文的基因排序分别对杨树胁迫耐受以及抗性基因进行基因排序和候选Hub基因挖掘;(3)通过PoplarGene的网络映射功能构建桉树功能基因网络,比较分析表明杨树功能基因网络更适合进行其他木本植物的功能基因网络映射;(4)使用PoplarGene对杨树木质部细胞发育基因进行顺式作用元件分析,获得26个富集的顺式作用元件。  3.基于公共数据库中获得木材形成发育基因,使用PoplarGene平台进行杨树术材形成发育基因的生物信息学系统分析:(1)基于PoplarNet获得毛果杨木材形成发育功能基因子网络,对子网络进行聚类分析发现该子网络主要由16个紧密关联的模块构成,模块的功能富集分析发现这些模块主要参与糖结合、序列特异的DNA结合、转录调控、水解酶活性、细胞壁修复等功能;(2)通过木材形成发育基因的适应性进化分析发现,大部分木材形成发育基因都经历了负选择作用,仅178个基因经历了正选择,在木材形成发育功能基因子网络中,受正选择的木材形成发育基因大都位于非Hub节点,且其连接度分布显著低于子网络中的随机节点,负选择的术材形成发育基因更倾向于连接度高的节点,排名前10位的基因有9个都受到了负选择;(3)通过构建木材形成发育基因的miRNA调控网络,获得151个毛果杨microRNA与142个毛果杨基因的调控网络,整个网络包含31个子网络,最大的子网络Subnetl含有42个节点,151个microRNA来源于19个microRNA家族,对调控网络中的基因的功能富集分析发现靶基因主要参与激素响应与转录因子DNA结合相关功能。  总之,杨树功能基因网络的构建以及PoplarGcne平台的开发将为杨树基因的功能研究提供重要参考信息及生物信息学平台,同时,随着杨树分子生物学研究数据的不断增加,PoplarNet以及PoparGene将不断更新和完善。综合木材形成发育基因功能基因了网络与microRNA调控网络挖掘新的杨树木材发育相关的关键基因和因子,可为进一步木材改良研究提供更多的信息,在木材形成发育基因功能子网络中居于重要节点的负选择基因,可作为木材遗传改良的候选靶基因,鉴定到的19个家族的microRNA可进一步通过相关分子生物学实验研究其在木材形成发育中的功能。

杨树;基因功能注释平台;功能基因网络;生物信息学

中国林业科学研究院

博士

林木遗传育种

苏晓华

2017

中文

S792.110.1

2019-04-16(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅