学位专题

<
DOI:10.7666/d.Y1932462

基于EST数据库和转录组测序的茶树DNA分子标记开发与应用研究

王丽鸳
中国农业科学院
引用
茶树(Camellia sinensis)是遗传研究和基因组信息比较缺乏的物种。目前,茶树上可有效利用的标记数量非常有限。本研究不仅以现有的公共EST数据库为基础进行茶树SSR和SNP分子标记开发应用研究,而且通过高通量RNA—seq获得大量茶树花的转录组序列,并以这转录组序列为基础进行茶树SSR分子标记的大规模发掘,主要研究结果如下:   (1)对NCBI网上公开的12,757条茶树ESTs序列进行聚类,成功构建了茶树的独立基因(Unigene)数据库,发现茶树的EST序列冗余率约为68.2%,明确了茶树EST—SSRs的分布特征,设计了206对SSR引物,筛选出多态性SSR引物59对。   (2)利用开发的SSR引物对茶树地方品种的遗传多样性取样策略和西湖龙井群体的遗传分化进行了研究,发现平均等位位点Na是最合适的遗传多样性取样参数,当用平均等位位点Na做参数,SSR引物等位位点数为5时,24个以上单株才能达到总体90%以上的遗传变异:龙井群体具有较高的遗传多样性水平,平均多态信息含量PIC为0.4382,中度多态位点占62.5%,高度多态位点占33.3%。哈迪-温伯格平衡检验表明,66.7%的SSR位点不符合哈迪-温伯格平衡。分子方差分析表明,西湖龙井五个居群间的遗传分化程度较低。   (3)初步建立了茶树EST-SNP开发体系,明确了茶树EST中SNP的分布规律,茶树编码区的SNP发生频率约为0.58%,平均200bp就有一个SNP位点,并进一步推算出茶树基因组DNA序列的杂合率约为0.38%,平均300个碱基就可能出现一个杂合位点。从237个多基因聚类簇中发现了818个SNP候选位点,设计了25对SNP引物进行DNA测序验证,发现EST—SNP候选位点的多态检出率为75%。   (4)应用新一代高通量测序技术对茶树花进行转录组测序,获得茶树花的转录组信息75,331条,平均序列长度为402bp,平均测序深度为23.45,平均测序覆盖度为0.895。通过基因表达水平RPKM值分布分析,发现茶树花的转录组以中低表达丰度的基因为主。经过和蛋白数据库NR、Swiss—Prot、KEGG和COG四个数据库比对,共有50,975条茶树花转录组的unigene被注释。   (5)对茶树花转录组表达信息进行大通量SSR位点的发掘,发现了含SSRs的序列10,290条,共12,582个SSRs,茶树花转录组中SSR出现的频率为16.66%。茶树转录组发现了340种碱基重复模式,在茶树花的转录组序列中共发现340种碱基重复模式,二碱基重复所占比例最高。茶树转录组所含微卫星序列长度呈偏正态分布,以重复长度小于15bp的SSR短重复序列最多,长度大于30bp的较长SSR序列重复所在比例很小。   (6)自动批量设计了2,633对SSR引物,成功率为42.85%。   本研究对茶树分子标记辅助育种及功能基因的发现等都具有重要的意义。

茶树;生物信息学;分子标记;转录组测序;数据库;辅助育种

中国农业科学院

博士

茶学

成浩

2011

中文

S571.1

113

2011-10-31(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅