GSEA使用(初级)

  • A+
所属分类:生物信息学

  首先我们先了解一下什么叫做基因富集分析

  基因富集分析是分析基因表达信息的一种方法,富集是指将基因按照先验知识,也就是基因组注释信息进行分类。

  2005年提出了基于基因集(gene set)定义的基因富集分析方法。 首先要定义基因集,也就是基于我们的先验知识(基因组注释信息),将基因富集,可以想象成,用一堆代表基因功能的箱子(bin)把具有相同或相似功能的基因装起来,起到了降维的作用,当然,每个基因可能同时参与好几种功能。

  这样,得到这两组数据后,我们所分析的不是单个基因表达的差异,而是箱子与箱子之间的差异。由此,我们得到的数据更容易解释。

  GSEA基本思想

  使用预定义的基因集,将基因按照在两类样本中的差异表达程序排序,检验预先设定的基因集合是否在这个排序表的顶端或者底端富集。

  GASEA原理

  PNAS文章Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles.Proc Natl Acad Sci U S A. 2005 Oct 25;102(43):15545-50. Epub 2005 Sep 30.

  GSEA如何使用

  我们只需要一个表达矩阵,并做出分组说明的cls文件

  说明书的测试数据http://software.broadinstitute.org/gsea/datasets.jsp

  数据要求格式:http://www.broadinstitute.org/cancer/software/gsea/wiki/index.php/Data_formats

  加载数据

  官网 http://software.broadinstitute.org/gsea/index.jsp

  官网下载 http://software.broadinstitute.org/gsea/downloads.jsp

  安装前需要安装好java环境

  官网说明书 http://software.broadinstitute.org/gsea/doc/desktop_tutorial.jsp

  • 蛋白质组学业务咨询
  • 扫码咨询相关问题
  • weinxin
  • 代谢组学业务咨询
  • 扫码咨询相关问题
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: