【StatQuest】置信区间

bootstraping

通过bootstrap来计算置信区间，帮助我们更好地理解置信区间。

假设我们需要测量雌性小鼠的体重，对总体抽样12次，测得12个样本。

Sampling with replacement: bootstrap的过程就是重复对这12个样本抽样。

重复这一抽样过程许多次，如10000次，每次都计算抽样后的均值。

那么95% 置信区间覆盖就是这10000个均值中95%的取值范围。

这是一个可视化的统计值，在置信区间外的取值就相对不可信。

假设这12个样本均值的置信区间为(21, 31)，那么所有雌鼠体重的“真实”均值小于20 的p-value一定小于0.05，这不太可能。或者说，雌鼠体重的均值与小于20的数值之间存在显著差异。

This is unlikeyly and beacuase fo this, we can say there is a statistically significant difference between the true mean and any value less than 20.

如果两批样本均值的置信区间没有重叠，那么这两组样品之间一定存在显著差异。

如果两组样本均值的置信区间存在重叠，它们也可能存在显著差异。只是这时，我们必须做t-检验来判定了。