现已不推荐使用RPKM/FPKM对RNA-seq数据进行定量比较,详情可查看

计算原理

$$ RPKM = (10^9 * C) / (N * L) $$

C = Number of reads mapped to a gene

N = Total mapped reads in the experiment

L = gene length in base-pairs for a gene

使用方法

1
perl rpkm_script_beta.pl sample_count_test.count 2:9 28 > sample_count_test.rpkm

其中,sample_count_test.count为用于计算的count矩阵,其中第2-9列为需要计算的样品的位置(C),第28列为每个基因的有效长度(L)。

参考来源

https://github.com/decodebiology/rpkm_rnaseq_count

https://www.bioinfo-scrounger.com/archives/342/