BatMeth2
序列比对
- 在进行数据比对前,需要准备基因组和索引文件
- 首先准备fasta格式的参考基因组
- 对于WGBS数据,建立索引:
BatMeth2 build_index GENOME.fa
- 对于RRBS数据,建立索引:
BatMeth2 build_index rrbs GENOME.fa
- DNA甲基化数据序列比对
- 单端数据
Batmeth2 align -g hg19.fa -i Read.fq -o outPrefix -p 6
- 双端数据
Batmeth2 align -g hg19.fa -1 Read_R1_left.fq -2 Read_R2_right.fq -o outPrefix -p 6
主要参数
--inputfile | -i 输入文件名称
--genome | -g 输入参考基因组名称
--outfile | -o 输出文件前缀
--indelsize 设置indel大小
--seed 设置比对seed长度。建议长度为n/2,n=read的长度
--maxhits | -m 设置查找的最大匹配数
--maxmismatches | -n 允许序列比对的最大错误匹配数
--non_directional 报告四种亚硫酸氢链的比对情况,默认:OFF
--single | -u 仅输出只比对到一端的比对结果
--insertsize | -s 设置原始的insert大小,默认是800bp
--threads | -p 设置线程数
--help | -h 查看使用说明
# 其他参数详见命令使用说明