【3】蛋白鉴定软件之Mascot

  • A+
所属分类:生物信息学

目录
是非常经典的蛋白鉴定软件,被Frost Sullivan形容为“质谱数据检索的黄金标准”,更新维护速度也很快(已发布到2.7版)。but,它是商业软件(国内康昱盛代理),收费。虽然有在线版本,但仅支持少量谱图检索,只能体验一下。大规模的蛋白组搜索必须使用它们的服务器。简述下特点:
支持目前主流的三种检索算法:即2D-PAGE + MALDI的 Peptide Mass Fingerprint (PMF),LC-MS或复杂MALDI的MS/MS Ion Search,以及Sequence Query功能进行分子量和碎片离子信息联合搜库。
特有的基于随机匹配概率的打分方法(另一种是经典的SEQUEST 2次打分算法),支持标准统计显著性检验分析
整合FDR阈值选项及Percolator大规模数据检索质量控制算法
可检索各种类型数据库,包括序列库和谱图库,也可自定义
支持几乎所有常用的质谱仪输出的数据格式
支持Web浏览器,给出概述性和详细的结果报告
mascot官网包含的东西很多,除了产品,它还提供了的资料,和文档,对于蛋白质组学入门者而言,可以多浏览了解了解。
Mascot服务器:

2.1在线版本
这里主要介绍串联质谱检索方法MS/MS Ions Search。点击进入
对主要的参数进行配置,比如数据库,物种,酶切,漏切,可变修饰,固定修饰,一二级误差及其单位,肽段价态,上传文件及格式,是否构建反库等。以下是一个简单的配置示例,仅供参考:

2.2 服务器版本
如果mascot部署已部署在本地服务器(如我们厂搭建在了集群上),需要通过服务器端口对酶、修饰、物种数据库等参数进行配置,然后在Linux环境中运行。mascot配置界面如下:

例如对物种数据库进行配置Databasea Maintenance

当然,如果你已经建好了库,下次可以从中选择继续用就行。建好库的标志就是在MASCOT search status page中显示In use,在Linux中则出现seq.a00, seq.errors , seq.fasta, seq.i00, seq.s00, seq.stats等文件
mascot服务器在Linux中的搭建和配置是比较复杂的,安装和配置指南我提供了一个文件供参考:
链接:
提取码: 5m1a
3.1 在线版本
上传mgf谱图文件,点击start search即可进行在线检索,但这个检索支持的谱图数非常有限,体验一下即可。
PS:第一次提交不会立即执行,会发送消息到邮件需要你验证,然后再配置运行。
3.2 服务器版本
Linux服务器版本,配置好数据库及其他参数后,可调用以下命令:
nph-mascot.exe 1 -commandline -f test.dat test.asc

得到mascot鉴定结果,并通过mascot提供的,得到进一步的详细结果:
perl export_dat.pl file=test.dat do_export=1 prot_hit_num=1 prot_acc=1 pep_query=1 pep_rank=1 pep_isbold=1 pep_isunique=1 pep_exp_mz=1 _quant_protein_ratio_type=median _quant_outliers_method=auto _min_precursor_charge=1 _quant_min_num_peptides=2 _quant_unique_pepseq=1 _quant_pep_threshold_type="at least identity" _quant_norm_method=median export_format=CSV _sigthreshold=0.05 _ignoreionsscorebelow=0.05 report=AUTO _server_mudpit_switch=0.000000001 show_same_sets=1 _requireboldred=1 search_master=1 show_header=1 show_decoy=1 show_mods=1 show_params=1 show_format=1 protein_master=1 prot_score=1 prot_desc=1 prot_mass=1 prot_matches=1 prot_cover=1 prot_seq=1 prot_quant=1 peptide_master=1 pep_exp_mr=1 pep_exp_z=1 pep_calc_mr=1 pep_delta=1 pep_start=1 pep_end=1 pep_miss=1 pep_score=1 pep_homol=1 pep_ident=1 pep_expect=1 pep_seq=1 pep_var_mod=1 pep_scan_title=1 pep_quant=1 use_homology=1 test.csv

一般而言,mascot得到的鉴定结果是.dat文件(当然也导出其他格式)。dat源文件比较复杂,常人是看不懂的(截取部分):

这时就有很多其他软件来对dat进行解析处理或者可视化。
对于官网提供的在线版本,mascot将结果生成了一份,清晰易懂。我这里就对结果不进行过多解释,不明白的地方也可查看help。

当然,我们也可以将dat文件导入如软件进行标记定量,或者导入等谱图可视化软件来进行鉴定结果查看。
Ref:

  • 蛋白质组学业务咨询
  • 扫码咨询相关问题
  • weinxin
  • 代谢组学业务咨询
  • 扫码咨询相关问题
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: