参考基因组及注释文件下载

  • A+
所属分类:多组学整合分析

GRCh38下载(默认):

GRCh37下载:

GRCh36及其他版本下载:

常用的GRCh37基因组大小压缩约900Mb,解压后约3G。人类的注释文件一直在更新,默认为GFF3格式。gff和gtf格式文件关系及相互转换见:
也可以通过NCBI的genome数据库下载,默认是GRCh38,若要下载其他版本,直接检索关键词。
如输入GRCh37或hg19:

 
参考序列和GFF文件均可从此处下载,其他物种类似。
 
2.Ensembl
同NCBI一样,可通过网页检索下载,也可通过ftp直接下载。
(1)官网下载:

 
 
或者通过进入download下载。
 
微生物或原生生物的下载,如幽门螺杆菌:

或者直接从这里进入:

 

 
(2)ftp下载:

更改release后的数字下载相应的版本,包括dna、cdna、cds等序列信息,release-75是目前最新的hg19版本。
注释文件下载(默认gtf,大部分比对软件输入格式):

 
3.UCSC
参考序列下载很简单(尤其是人)
进入官网:,下载对应的各个版本
也可进入,修改中间数字下载不同版本
但是注释文件下载稍微有点麻烦,需要设置一系列参数来生成:

Select the following options:
clade: Mammalgenome: Humanassembly: Feb. 2009 (GRCh37/hg19)group: Genes and Gene Predictionstrack: UCSC Genestable: knownGeneregion: Select "genome" for the entire genome.output format: GTF - gene transfer formatoutput file: enter a file name to save your results to a file, or leave blank to display results in the browser
Click 'get output'.
 
Reference:

 

  • 蛋白质组学业务咨询
  • 扫码咨询相关问题
  • weinxin
  • 代谢组学业务咨询
  • 扫码咨询相关问题
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: