学位专题

目录>
<
DOI:10.7666/d.Y2910760

干细胞中microRNA和靶基因相互作用的数据库

苏小蓉
南方医科大学
引用
背景:  生物信息学分析表明人类全部基因的三分之一都受到miRNA的调控,这表明miRNA分子实际上是基因调控网络中的核心成分。miRNA在多种生物的进程中起到了关键的作用,分别为调节细胞早期发育、细胞增殖、干细胞分化和凋亡,而突变的miRNA则与多种疾病和肿瘤相关。在生物体内,miRNA的特异性都不是很明显,往往是一个miRNA对多个靶基因作用,也可能有多个miRNA对一个靶基因进行调控的情况。miRNA的调控作用可能构成一种复杂网络,而且它自己也受到其他条件的调控作用。全部正常的细胞分化过程都可以随着miRNA表达谱的改变而改变,这种改变的反常就是各种肿瘤所共有的特性。所以,miRNA可能成为新的癌症分类、分型甚至分期的标记。由于其靶基因种类很多而且数量庞大,miRNA普遍介入到许多细胞信号转导系统中,并与其共一起组成巨大的调控网络,从而施展多种生物学功能。miRNA通过与信号蛋白直接或者间接作用来介入到肿瘤发生相关的信号转导过程里,进而影响肿瘤发生。甚至有研究表明,一些与肿瘤相关的信号转导通路可以直接调节某些特别的miRNA的表达。  材料和方法:  1.数据筛选  随着生物信息学的兴起,文献的挖掘慢慢成为生物医学的研究辅助手段,同时也成为大范围获取原始数据的重要手段之一;为推进疾病的诊断、预防和治疗研究起到关键作用。文献的挖掘在很多重要的生物信息范围(例如,获取蛋白质之间的作用、基因功能注释和生物通路等)起到关键作用。GenCLiP2.0结合了文献挖掘和数据库挖掘的能力,可以给生物医学研究人员提供一站式的服务,同时能够利用他们的专业知识对信息进行深度挖掘。GenClip2.0在查询摘要或者句子中基因的基础上,简历了摘要和句子中的单词和词的索引,系统可以根据用户提交的查询词汇迅速查找与它相匹配的摘要或者句子还有其中的基因,确定和查询词汇共发生的全部基因。  2.数据库构建  MySQL数据库根据结构化查询语言(Structured Query Language,SQL)来实现和数据库之间的交流。SQL语言的主要功能就是构建各种数据库系统操作指令,用于插入、查询、修改或删除各类数据库对象。实现和MySQL的交互方式有指令行、编程接口、各类本地和远程的客户端。最方便快速的方法是通过指令行与数据库直接交流,在对SQL语言熟练的前提下,可以用编程接口对大数据量进行操作。对于不熟悉SQL语言的或者想方便日常管理的用户可以使用客户端,进行可视化的操作。  1)下载WampServer软件,并安装调试。  2)新建数据库,名称为“anaysis_of_ microRNA”。  3)数据库创建的下一步是对表格的创建。在数据库中新建表格,名称为“microrna_stemcell_targetgene”。  4)将目前得到的记录加载到数据库中。加载数据有两种方法,第一种方法为在MySQL命令提示符下,对每一条记录进行加载到数据库中,该方法保证了数据的准确性,及时发现所加载数据存在的问题,但是消耗大量时间和人力;另外一种方法为将所收集的记录经Excel表格进行“.csv”格式转换,在WampServer软件利用数据直接加载控件直接将转换的记录加载到数据库中,该方法可以节省时间,缺点为精确性不够,不能实时发现所加载数据存在的问题。因此,在记录加载中,应结合实际,合理使用两种方法。  5)数据加工  浏览加载到数据库的数据,将不能正常显示的数据进行改正。  3.网站建设  在浪潮高性能计算集群服务器上,使用LAMP组合(Linux+ Apache+ MySQL+PHP/Perl),即整个系统工作在Linux平台,Web服务器是Apache,使用MySQL作为数据库系统,同时运用PHP/Perl脚本语言联合HTML语言和JavaScript进行系统开发。在最大的限度上设计出一个稳定并且容易扩展的网络系统,和一个简单而且方便操作的网页界面。  PHP是一种执行于服务器端的,嵌入HTML文档的脚本语言,语言风格与C语言相类似,如今被许多的网站编程职员普遍的使用。在WEB服务器端中PHP脚本的运行方法:当WEB服务器收到一个WEB页面请求的时候如果请求的是HTML文件,WEB服务器就直接给浏览器提供文件的显示功能;如果请求的文件是以“.php”为扩展名的,则WEB服务器先把文件传给PHP引擎执行,分析两个PHP分界符号之间的PHP程序,然后再将PHP程序按照程序运行的时候各类差异的条件转换为相呼应的HTML代码返回给客户端的浏览器。PHP奇特的语法包含了C、Java、Perl以及PHP自创的语法,执行动态网页比CGI和Perl更加快速。  1)网页整体布局。网页一共分为五个部分,分别为:header1、header2、header3、menu、 cytoscapeweb。  2)连接数据库。该课题的成败在于是否可以顺利连接相对应的数据库。  3) microRNA、干细胞、靶基因之间的组合设置,共有八种组合关系。  4)关于microRNA和靶基因配对的图像显示。将想对应的microRNA和靶基因放入同一个数组中,其中microRNA为$geneNode[$id1],靶基因为$geneNode[$id2]。  结果:  1.登陆GenClip2.0(http://ci.smu.edu.cn/GenCLip/analysis.php),获得包含关键词为干细胞的的基因498个。  2.将获得的基因复制到Excel2007中进行筛选,选择以“MIR”开头的基因,63个。  3.将以“MIR”开头的基因重新输入GenClip2.0中,分别选择关键词,得到286篇相关文献。  4.对相关文献摘要进行详细阅读,收集文献的题目、PMID以及文献涉及的干细胞类型、物种类型、靶基因、microRNA和靶基因之间的相互关系。  5.去掉没有靶基因和干细胞类型的数据,最终获得356条记录。  从上述所得数据可以得到:  1.涉及文章118篇;  2.记录中共涉及4种动物模型,分别为人类、小鼠、大鼠、转基因小鼠;  3.microRNA中共收集58种,其中前三位分别为MIR145(共有55条记录)、MIR21(共有31条记录)、MIR34A(共有16条记录);  4.靶基因中共收集153种,其中前三位分别为Oct4(共有19条记录)、Nanog(共有19条记录)、Sox2(共有17条记录);  5.干细胞类型中共收集53种,其中前三位分别为mesenchymal stem cells(共有66条记录)、embryonic stem cells(共有38条记录)、breast cancer stemcells(共有27条记录)。  6.干细胞中microRNA和靶基因相互作用的系统提供了三种检索词选择,分别为干细胞类型、microRNA、靶基因等,可以形成八种不同的组合方式。  7.结果显示了该检索词搭配条件下所检索到的数量,以表格的方式显示该检索结果的序号、实验动物、干细胞类型、microRNA、靶基因、作用以及来源文献,其中microRNA和靶基因可以链接到NCBI的GENE中相对应的基因介绍网页,来源文献可以链接到NCBI的PubMed中所对应的网页,让使用者能够快速、有效地了解所检索信息的相关信息。同时,在网页下方形成一个关系图,直观地展示出检索得到的microRNA和靶基因之间的相互关系,所形成的关系图可以进行放大缩小等常规操作。  结论:  干细胞中microRNA和靶基因相互作用的数据库的开发最大程度上设计出一个稳定并且容易扩展的网络系统,同时是一个简单并且容易操作的网页界面。结果显示了该检索词搭配条件下所检索到的数量,以表格的方式显示该检索结果的序号、实验动物、干细胞类型、microRNA、靶基因、作用以及来源文献,其中microRNA和靶基因可以链接到NCBI的GENE中相对应的基因介绍网页,来源文献可以链接到NCBI的PubMed中所对应的网页,让使用者能够快速、有效地了解所检索信息的相关信息。同时,在网页下方形成一个关系图,直观地展示出检索得到的microRNA和靶基因之间的相互关系,所形成的关系图可以进行放大缩小等常规操作。解决了由于实验原始数据众多,杂乱无章,无法快速获得所需干细胞类型中microRNA与靶基因的相互作用关系的问题,给使用者的后续实验提供参考,降低实验成本。然而,该系统还存在一些不足,收集文献共118篇,在数量上不能很好地突出该实验的优势。没有收集文献中所涉及的实验材料和方法,对于实验者后续实验的指导作用明显减弱,不能高效地进行更新,不能显示实验材料和方法,网页页面不够精美。

干细胞;微小核糖核酸;靶基因;数据库

南方医科大学

硕士

遗传学

黄仲曦

2015

中文

R318.04

73

2016-03-30(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅