【StatQuest】置信区间
文章目录
bootstraping
通过bootstrap来计算置信区间,帮助我们更好地理解置信区间。
假设我们需要测量雌性小鼠的体重,对总体抽样12次,测得12个样本。
Sampling with replacement: bootstrap的过程就是重复对这12个样本抽样。
重复这一抽样过程许多次,如10000次,每次都计算抽样后的均值。
那么95% 置信区间覆盖就是这10000个均值中95%的取值范围。
Confidence interval 的意义
这是一个可视化的统计值,在置信区间外的取值就相对不可信。
假设这12个样本均值的置信区间为(21, 31),那么所有雌鼠体重的“真实”均值小于20 的p-value一定小于0.05,这不太可能。或者说,雌鼠体重的均值与小于20的数值之间存在显著差异。
This is unlikeyly and beacuase fo this, we can say there is a statistically significant difference between the true mean and any value less than 20.
Compare two samples
如果两批样本均值的置信区间没有重叠,那么这两组样品之间一定存在显著差异。
One Caveat
如果两组样本均值的置信区间存在重叠,它们也可能存在显著差异。只是这时,我们必须做t-检验来判定了。