使用salmon计算RNA-seq表达量矩阵
文章目录
传统的RNA-seq分析方法需要将reads比对到基因组上,然后再统计每个基因的counts,进而计算TPM/FPKM。现在,发展出了许多alignment-free的方法,不需要进行比对,直接统计出count矩阵。
安装
salmon直接提供了linux的预编译版本,解压后可直接使用。
|
|
准备输入数据
-
参考转录组,即目标物种的cdna序列
-
比对文件(alignment-based mode)或测序文件(quasi-mapping-based mode)
是的,salmon可以不经过比对,直接以测序数据作为输入
建立索引
|
|
20190622 更新
在0.14.0 新版本中,salmon引入了新的索引方式,且旧版本产生的索引不能在0.14.0版本后通用
新的方式依赖于SalmonTools中提供的脚本,提供基因组,gtf注释与cds序列,生成
decoys.txt
与gentrome.fa
1 2 3
bash /path/to/scripts/generateDecoyTranscriptome.sh -a ~/reference/annotation/mm/mm.gtf -g ~/reference/genome/mm/mm.fasta -t ~/reference/collection/mm/mm.cds.fa -o mm cd mm salmon index -t gentrome.fa -d decoys.txt -i ./
定量计算
|
|
导出表达量矩阵
使用tximport
导入或导出上游软件计算的表达量矩阵
count矩阵
|
|
参考来源
https://salmon.readthedocs.io/en/latest/salmon.html
https://www.jianshu.com/p/7564eca62354