安装

RIPCAL最新版应为2.0版本,但其软件主页默认下载项却仍为1.0.4版本,应当注意下载时的选择。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
wget http://nchc.dl.sourceforge.net/project/ripcal/RIPCAL/RIPCAL_2.0/ripcal2_install.zip
unzip ripcal2_install.zip
mkdir ~/opt/ripcal2/
mv ripcal2_intall/perl/* ~/opt/ripcal2/
chmod 755 ~/opt/ripcal2/*
mv ripcal2_install/RIPCAL_manual_v1_0.pdf ~/opt/ripcal2/
echo 'PATH=$PATH:~/opt/ripcal2/' >> ~/.bashrc
source ~/.bashrc

#安装需求的模块
cpanm Math::Round Tk

配置

RIPCAL默认调用clustalw进行多序列比对,若目前使用的是clustalw2,则需要做相应的修改。

1
2
vi ~/opt/ripcal2/ripcal
# 将system()括号内的clustalw修改为clustalw2

输入文件

FASTA

RIPCAL接受标准的FASTA/Pearson序列格式,或FASTA多序列比对格式

GFF

在分析多于一个重复序列家族时,RIPCAL要求输入GFF文件。输入的GFF文件第1列为序列ID,第3列为Repeat_Region,第9列中以Target标签标注重复序列的种类。

运行

1
2
3
4
5
6
7
#Alignment-based mode
ripcal -c --type align --seq input.fasta --gff input.gff --model consensus
ripcal_summarise *_RIPALIGN.TXT > outputfile
#Di-nucleotide mode
ripcal -c -t index -s input.fasta -g input.gff
# Index scan mode
ripcal -c -t scan -s input.fasta

参考来源

https://sourceforge.net/projects/ripcal/files/RIPCAL/RIPCAL_2.0/RIPCAL_manual_v1_0.pdf