代谢组学精华汇总

  • A+
所属分类:代谢组学

  代谢组学的介绍

  代谢组学那些事儿

  代谢组数据处理

  代谢组学数据分析的统计学方法综述

  典型机器学习算法在代谢组学数据分析中的应用和比较

  代谢组学数据处理

  非靶向代谢组学数据处理的基本流程

  代谢组学生物信息分析的那些事儿

  一文看懂主成分分析

  运用ROC曲线筛选生物标志物的策略

  关于筛选标记物

  筛选差异代谢产物通常基于OPLS-DA模型,因为它更易于进行模型解释,所有跟分组相关的信息都集中于第一维。筛选的标准通常是基于以下两个指标:

  Corr.Coeffs./p(corr) (Correlation Coefficient),是样本得分值t和变量X间的相关系数-Corr(t, X),代表了变量的可靠度。该值没有固定阈值,通常设定对应的P值 < 0.05。

  VIP (Variable importance in the projection),为变量对模型的重要性,描述了每一个变量对模型的总体贡献,通常设定阈值为VIP >1。

  除此之外,基于单维检验的P值和变化倍数(Fold change)所作的火山图(Volcano plot)也是常用的筛选方法。

  关于标记物的筛选

  代谢组学活性筛选(metabolomics activity screen, MAS)

  PLS-DA和OPLS-DA

  可以根据V-plot筛选代谢物(本质是综合VIP和P值 [所谓的Corr.Coeffs的P值]?),OPLS-DA的分析中还可以用S-plot筛选代谢物(横坐标是P,纵坐标是P(corr),不太理解)。这两个图绕晕了,有不少资料,比如有个文章(Analysing NMR Metabolomics data using OPLS-DA )就示范了OPLS-DA及其S-plot。关于这两个图的文章,主要是:代谢组学数据处理 中提到。

  模型评估指标:(R2X, R2Y, Q2, R2, Q2)

  通常,评价(O)PLS-DA 模型拟合效果使用R2X、R2Y和Q2Y这三个指标,这些指标越接近1 表示PLS-DA 模型拟合数据效果越好。其中,R2X 和R2Y 分别表示PLSDA分类模型所能够解释X 和Y 矩阵信息的百分比,Q2Y 则为通过交叉验证计算得出,用以评价PLS-DA模型的预测能力,Q2Y 越大代表模型预测效果较好。

  PCA分析中R2X >0.4为好;PLS-DA 和 OPLS-DA分析中,R2X 这个参数不重要了,主要是R2Y 和Q2,这两个值>0.5 为好,越接近1越好。OPLS-DA中Q2(cum),是指建模后模型的预测能力,以大于0.5为宜,越接近1越好,cum 表示累积的意思。另外一个Q2 是进行模型验证,以防止随机拟合或过拟合的一个评价参数。

  另外,在介绍ropls这个包的网站上,对于实现PLS-DA、OPLS-DA有代码的讲解,链接为:ropls: PCA, PLS(-DA) and OPLS(-DA) for multivariate analysis and feature selection of omics data

  值得参考的其他文章

  什么是(O)PLS-DA?什么是VIP?

  (O)PLS-DA&VIP分析

  OPLS vs PCA: Explaining differences or grouping data?

  代谢组学工具

  SIMCA、MetaboAnalyst(Mummichog)、PIUMet、Cytoscape、Heml(做热图的)、Proteowizard(格式转换工具)等。

  SIMCA操作可以借鉴下这个:SIMCA14.1 Omics Skin操作教程--药物疗法(核磁共振氢谱)。

  代谢组学其他东西

  在代谢组学文章投稿时,都需要列出已鉴定化合物的检测分子量的误差,这个通常需要自己计算,计算方法如上述例子。这里介绍一个计算精确分子量的网。

  ——摘自:代谢组学分享平台—质谱知识2.

  模型建立后需要进行验证,如置换检验、交叉验证。

  如果是两组比较,也可以通过OPLS-DA的S-plot进行标记物筛选。选择分布在S-plot两端的变量作为标记物,同时可以参看得分图(Score plot)来观察变量在不同组别的相对含量高低(即处于S-plot右上方的变量在得分图中处于y轴右侧的组别中含量较高,反之亦然)。

  多组学

  O2PLS技术值得研究下

  O2PLS模型关联分析

  O2PLS for Multi-Omics

  刷爆朋友圈的多组学联合,轻松搞定分子调控机制-表型间的关联!

  答疑

  代谢组学常见问题知多少

  代谢组学常见问题Q&A

  代谢组学入门十问

  代谢组学问答四十八式,准备好接招了吗?(一)

  代谢组学问答四十八式,准备好接招了吗?(二)

  代谢组学问答四十八式,准备好接招了吗?(三) (有提到OPLS-DA的评估参数问题)

  代谢组学问答四十八式,准备好接招了吗?(四)

  • 蛋白质组学业务咨询
  • 扫码咨询相关问题
  • weinxin
  • 代谢组学业务咨询
  • 扫码咨询相关问题
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: