生物信息学应用:序列分析、电子克隆等初探

  • A+
所属分类:生物信息学

生物信息学可指利用信息技术管理和分析生物学数据。这就意味着生物信息学所涉及的范围相当广泛,从人工智能、机器人一直到基因组(genome)分析。就基因组分析这一角度来看,生物信息学主要是指核酸和蛋白质序列数据的计算机处理和分析。近年来,蛋白质结构数据的快速增长,使蛋白质三维结构的处理分析也归入到生物信息学的范畴。

近年来,三大国际一级生物信息数据库,即美国国家信息中心(National Center of Biotechnology Information,NCB)的Gen Bank、欧洲分子生物学室验室(European Molecular Biology Laboratory-Euro-pean Bioinformatics Institute, EMBL-EBI)的EM-BL 和日本DNA数据库(DNA Data Bank of Japan,DDBJ) 新收录的核酸序列数据中,EST占65%以上。

随着生物信息学(Bioinformatics)的发展,通过检索数据库进行核酸序列同源性检索,电子基因定位、电子延伸、电子克隆和电子表达以及蛋白质功能分析、基因鉴定等方面起到了重要作用,已成为人们认识生物个体生长发育、繁殖分化、遗传变异、疾病发生、衰老死亡等生命过程的有力工具。

1、核酸序列的同源性检索

目前,通过数据库查询、cDNA文库直接测序、mRNA差别显示(DDRT-PCR)、代表性差示分析(RDA-PCR)和抑制差减杂交(SSH)等方法获得的EST数据越来越庞大。GenBank数据库中收录的EST序列有数百万个之多。

由于EST代表着一段表达基因序列,这样就可用其与公共数据库进行同源性检索,检索与其同源的核酸序列。典型分析是采取NCBI的Blast软件对GenBank中的非冗余数据库(non-redundant database,nr)进行查询。

该数据库是对GenBank EMBL 和DDBJ中去除所有相同核酸序列进行整合后所得的最为全面的已知基因数据库,其中包括部分基因组序列。联网至选择数据库“Nucleotide”,利用blastn程序进行同源性检索。按照提示进行查询。

2、比较基因组分析

达尔文的进化论给比较基因组学提供了理论依据。动物进化从低等到高等,动物与动物之间存在着亲缘关系。这种关系可以从基因序列上反映出来。亲缘关系越近,其基因序列的同源性就越高。可以根据已经亲缘关系较大的动物的基因序列来扩增目的基因的序列。

3、利用Unigene数据库进行电子克隆

此分析需要联网至选择数据库“dbEST”,利用blastn程序进行同源性检索。一般情况下可从EST数据库中检索到一批与代分析序列高度同源的EST序列。选择同源性比分最高的一条EST序列。从NCBI的UniGene数据库中进行检索,得到相应的UniGene编号。

获得待分析序列的UniGene编号以后,就可以将与UniGene Cluster的所有核酸序列下载到本地,利用SequencherTM或其他的序列装配软件进行组装。形成较长的新生序列。

4、cDNA序列的开放阅读框分析

大量的实验证明,在真核生物起始蛋白质合成时,40S核糖体亚基及有关合成起始因子首先与mRNA模板靠近5`末端处结合,然后向3`末端滑行,发现AUG起始MM子时,与60S大亚基结合形成80S起始复合物。开始转译蛋白质。这就是Kozak提出的真核生物蛋白质合成起始的“扫描模式”。

MRNA需要翻译为蛋白质方能发挥生物学作用,因此,核酸序列的开放阅读框(open reading frame.ORF)的分析便成为核酸分析的一个重要部分。基于遗传MM表,可通过计算机方便分析核酸序列的读码框。联网至 finder,输入cDNA序列,计算机将按照六种相位翻译成蛋白质。

  • 蛋白质组学业务咨询
  • 扫码咨询相关问题
  • weinxin
  • 代谢组学业务咨询
  • 扫码咨询相关问题
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: