无需登录 数据私有 本地保存

置信区间可视化 - 抽样与区间估计

17
0
0
0
参数设置
100 范围: 20–200
15 范围: 2–50
30 范围: 5–200

总体分布 vs 抽样分布(含当前样本置信区间)
多次抽样置信区间 覆盖率: --
--
样本均值 x̄
--
标准误 SE
--
置信区间
--
覆盖 μ?
常见问题与知识点

置信区间(Confidence Interval)是对总体参数(如总体均值μ)的一个区间估计。它给出了一个范围,我们认为这个范围以一定的置信水平(如95%)包含了真实的总体参数。例如,95%置信区间 [94.6, 105.4] 意味着:如果我们重复抽样很多次,大约95%的置信区间会包含总体均值μ。注意:不能说"μ有95%的概率落在这个区间内"——μ是固定值,区间才是随机的。

95%置信区间的正确解读是:如果我们从同一总体中重复抽取相同大小的样本无数次,并计算每个样本的95%置信区间,那么大约95%的区间会包含真实的总体参数。在上方的可视化工具中,您可以直观地看到这一点——绿色线段(覆盖μ)通常占绝大多数,红色线段(未覆盖μ)约占5%。

样本量n越大,置信区间越窄(越精确)。这是因为标准误 SE = σ/√n 随着n的增大而减小。例如,n从30增加到120,标准误减半,区间宽度也减半。直观理解:更大的样本提供了更多信息,因此对总体参数的估计更精确。您可以在工具中拖动"样本量"滑块来观察这一效果——抽样分布曲线会变得更窄,置信区间线段也会缩短。

标准差(σ)描述的是总体中个体数据的离散程度。标准误(SE = σ/√n)描述的是样本均值的波动程度——即样本均值作为估计量的精确度。标准误总是小于标准差(当n>1时)。在分布图中,较宽的钟形曲线是总体分布(反映σ),较窄的钟形曲线是抽样分布(反映SE),两者对比非常直观。

中心极限定理(CLT)指出:无论原始总体是什么分布,只要样本量足够大(通常n≥30),样本均值的分布都近似服从正态分布。其均值为总体均值μ,标准差为标准误σ/√n。这就是为什么我们可以使用正态分布来构建置信区间——即使我们不知道总体的确切分布形态。本工具假设总体为正态分布以便于可视化,但CLT保证了方法在更大范围内的适用性。

不一定。置信水平越高(如99% vs 95%),置信区间越宽。这意味着更高的"把握"以牺牲精确度为代价。99%置信区间比95%更宽,虽然更可能包含μ,但给出的范围也更模糊。选择置信水平需要在把握和精确度之间权衡,95%是学术研究和商业分析中最常用的平衡点。