捋一下测序后生信分析内容及其常用软件

  • A+
所属分类:多组学整合分析

当我们测完序拿到原始数据之后,第一件事肯定是进行rawdata进行过滤。质控过滤软件如fastqc、multiQC、trimmomatic等。
得到基因组的clean reads后,无非两件事,一是denovo组装,构建参考序列;二是重测序,分析变异及后续基因表达定量、功能等下游分析。
1. 基因组组装
物种从头测序的黄金时代已经过去,该测完的、容易测的大多数已经测完了。
一个物种的基因组组装分析结果及其所用软件往往包含以下内容:

组装- 注释- 比较基因组分析- 后面可能会加点功能分析或者搭建类似JBrowse基因组浏览器。
组装软件:SOAPdenovo,ALLPATH-LG等等;
注释软件:Fgenesh、GeneWise、Augustus、RepeatModel、RepeatMasker等等。
2. 基因组重测序
有了参考序列的情况下,将原始reads比对回基因组,即重测序分析,可以说现在的绝大部分生信分析都是针对重测序,只是应用到其他各个不同领域,我们也可以说,这就是后基因组时代。分析常常包括:

比对- 变异检测(SNP、InDel、CNV、SV等)- 群体分析(PI、LD、Fst等)- 后续一些功能方面的分析。
比对:BWA、Bowtie2、SOAP、Samtools等。比对完生成sam/bam文件,有人说你对bam文件格式的熟悉程度就是你做重测序项目经验的体现。
变异检测:常用GATK来进行SNP、InDel等变异检测,这一步叫做call变异,最后生成一个vcf格式文件。再用vcftools/bcftools等软件过滤掉质量低的不可靠的变异位点。用SnpEff软件对变异位点进行注释,及这些变异对基因功能产生什么影响。
3. 转录组测序
以上测的是基因组序列,如果是转录组,也是分为有参考基因组和无参考基因组两种情况来分析。

(组装- )比对- 表达量- 差异- 功能等分析。当然也会有一些RNA结构的分析,如可变剪接、融合基因等等。

  • 蛋白质组学业务咨询
  • 扫码咨询相关问题
  • weinxin
  • 代谢组学业务咨询
  • 扫码咨询相关问题
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: