数据库下载
nr数据库下载前应确认其序列ID中包含有gi信息。推荐通过NCBI提供的脚本进行下载。
1
|
perl update_blastdb.pl nr
|
下载完成后解压
建库
由于下载的是nr数据库建库后的文件,因此不需要再通过makeblastdb进行建库。
此外,如果想要在blast结果中添加物种名称,则需要手动下载nr数据(FASTA格式)以及gi与taxid的映射文件,在makeblastdb时通过-taxid_map gi_taxid_nucl.dmp参数将映射信息包含在库中。
其他
同时,使用blastdbcmd可以从库文件中提取序列
1
|
blastdbcmd -db nr -dbtype prot -entry all -outfmt "%f" -out nr.fa
|
使用blast_formatter可以将asn格式(outfmt 11)转换为其他格式
1
|
blast_formatter -archive "test.blastn@nr.asn" -outfmt "7 qseqid sseqid pident length mismatch gapopen qstart qend sstart send evalue bitscore staxids salltitles" > "test.blastn@nr.tab"
|
参考来源
http://blog.shenwei.me/local-blast-installation/
https://segmentfault.com/a/1190000012055972