BatMeth2

序列比对

- 在进行数据比对前,需要准备基因组和索引文件

  1. 首先准备fasta格式的参考基因组
  2. 对于WGBS数据,建立索引:
    BatMeth2 build_index GENOME.fa 
  3. 对于RRBS数据,建立索引:
    BatMeth2 build_index rrbs GENOME.fa 

- DNA甲基化数据序列比对

  1. 单端数据
    Batmeth2 align -g hg19.fa -i Read.fq -o outPrefix -p 6
  2. 双端数据
    Batmeth2 align -g hg19.fa -1 Read_R1_left.fq -2 Read_R2_right.fq -o outPrefix -p 6

主要参数

 --inputfile | -i      输入文件名称
 --genome | -g         输入参考基因组名称
 --outfile | -o        输出文件前缀
 --indelsize           设置indel大小
 --seed                设置比对seed长度。建议长度为n/2,n=read的长度
 --maxhits | -m        设置查找的最大匹配数
 --maxmismatches | -n  允许序列比对的最大错误匹配数
 --non_directional     报告四种亚硫酸氢链的比对情况,默认:OFF
 --single | -u         仅输出只比对到一端的比对结果
 --insertsize | -s     设置原始的insert大小,默认是800bp
 --threads | -p        设置线程数
 --help | -h           查看使用说明
# 其他参数详见命令使用说明