NECAT组装ONT long reads

  • A+
所属分类:基因组学

NECAT 可用于ONT数据的纠错,组装,如果想对ONT long reads进行call SV,也可以使用necatsv.

githup网址:https://github.com/xiaochuanle/NECAT/blob/master/README.md
安装
两种方法:

第一种方法

wget https://github.com/xiaochuanle/NECAT/releases/download/v0.0.1_update20200803/necat_20200803_Linux-amd64.tar.gz
tar xzvf necat_20200803_Linux-amd64.tar.gz
cd NECAT/Linux-amd64/bin
export PATH=$PATH:$(pwd)

第二种方法

git clone https://github.com/xiaochuanle/NECAT.git
cd NECAT/src/
make
cd ../Linux-amd64/bin
export PATH=$PATH:$(pwd)

最后加入环境变量即可
简单使用

Step 1 配置文件

necat.pl config config.txt

会得到一个config.txt的配置文件,并对其进行配置,比如
PROJECT=17s1XX
ONT_READ_LIST=read_list.txt
GENOME_SIZE=1000000000
THREADS=4
MIN_READ_LENGTH=3000

起他可以默认即可
read_list.txt 为long reads的绝对路径

Step 2 correct raw reads

necat.pl correct ecoli_config.txt

只对40X(PREP_OUTPUT_COVERAGE)的reads进行纠错,Corrected reads路径位于./17s1XX/1-consensus/cns_iter${NUM_ITER}/cns.fasta.

Step 3 组装

necat.pl assemble ecoli_config.txt

针对纠错后的reads进行组装,如果么有纠错,则自动进行纠错步骤.
运行结果位于./17s1XX/4-fsa/contigs.fasta.

Step 4 Bridge contigs

necat.pl bridge ecoli_config.txt

结果位于:./17s1XX/6-bridge_contigs/bridged_contigs.fasta.
如果设置了POLISH_CONTIGS,则会利用纠错后的reads 对bridged contigs进行polish。
结果位于:6-bridge_contigs/polished_contigs.fasta
多节点计算
如果使用的是PBS或者SGE系统,可以设置配置文件中的如下参数进行多节点运行
USE_GRID=true
GRID_NODE=4

欢迎扫码交流

  • 蛋白质组学业务咨询
  • 扫码咨询相关问题
  • weinxin
  • 代谢组学业务咨询
  • 扫码咨询相关问题
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: