【蛋白质基因组】Proteogenomics方法介绍及分析思路

  • A+
所属分类:多组学整合分析

利用蛋白质组学数据,结合基因组数据(DNA)、转录组数据(RNA)来研究基因组注释问题,被称为蛋白质基因组学。“蛋白质基因组学”一词由Jaffe 等于2004 年首次提出,作者采用串联质谱数据匹配DNA翻译得到氨基酸序列的方法,在仅有810 kb 大小的细菌基因组上直接鉴定开放阅读框(open reading frame,ORF),验证并补充、修订了约10%的ORF。后来这种质谱数据结合DNA 和RNA 数据的分析方法被应用到注释病毒基因组、原核生物基因组以及真核生物基因组。
本来只是利用蛋白质组的质谱数据完善基因组注释的方法,近年来却因为“精准医疗”带火了。各种癌症利用这一方法砸钱发了一篇又一篇的CNS文章。
想更多了解,看综述文章:

不讨论精准医疗方面的利用(聚焦于突变位点的研究),重点谈论蛋白质基因组中对基因组重注释的信息分析方法。
目前,基于质谱技术的蛋白组学对于研究生物体所有蛋白质在时间、空间的表达作出了重要的贡献。与核酸测序技术不同的是,蛋白组技术并不能一个一个氨基酸检测出来,而是通过质谱图与理论的蛋白序列来进行匹配。然而,这个技术必须建立这样的假设上:
1)该物种基因组被完全测序且的绝大多数基因注释都比较完善。
2)公共数据库含有较为完整的蛋白序列。
然而,目前并不是所有基因的注释都十分清楚,如氨基酸突变、新的蛋白编码位点和可变剪切。
蛋白质基因组学技术(Proteogenomics)旨在基于蛋白质谱数据,结合基因组和转录组的注释信息,在蛋白层次上挖掘、验证:

  • 蛋白质组学业务咨询
  • 扫码咨询相关问题
  • weinxin
  • 代谢组学业务咨询
  • 扫码咨询相关问题
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: