无需登录 数据私有 本地保存

抽样分布对比器 - 多种统计量实验

10
0
0
0

📊 抽样分布对比器

多种统计量实验 · 可视化对比正态分布、t分布、卡方分布与F分布

📋 曲线配置
悬停画布查看各曲线数值
📈 分布统计量对比
曲线分布类型均值方差标准差偏度超额峰度

❓ 常见问题与知识点

抽样分布是指从同一总体中反复抽取样本时,某个统计量(如样本均值、样本方差)的分布。它是统计推断的基石——我们通过抽样分布来评估样本统计量的变异性,从而进行假设检验和构建置信区间。中心极限定理就是关于抽样分布的一个重要结论。

正态分布适用于已知总体标准差的情况。t分布由Gosset(笔名Student)提出,用于小样本且总体标准差未知时对均值的推断。t分布比正态分布有更厚的尾部(更保守),随着自由度(样本量)增大,t分布逐渐趋近标准正态分布。通常n≥30时两者差异很小。

卡方分布是多个独立标准正态随机变量的平方和的分布,广泛应用于:①分类数据的拟合优度检验;②列联表的独立性检验;③方差估计和置信区间;④似然比检验。其形状由自由度k决定——k较小时严重右偏,k增大后趋近正态分布。

F分布是两个独立卡方变量(各自除以其自由度)的比值分布,核心应用包括:①方差分析(ANOVA)——检验多组均值是否相等;②回归分析中检验模型整体显著性;③两样本方差齐性检验。F分布有两个自由度参数(分子自由度d₁和分母自由度d₂),形状灵活多变。

自由度可以理解为独立信息的数量。对于t分布,自由度越小尾部越厚;自由度→∞时t分布收敛于标准正态。对于卡方分布,自由度k增大时分布从严重右偏逐渐对称化(均值=k,方差=2k)。对于F分布,两个自由度共同决定形状——d₁控制峰值位置,d₂影响尾部厚度。

从数学上看,t分布的概率密度函数中,当自由度ν→∞时,因子(1+t²/ν)^(-(ν+1)/2)趋近于e^(-t²/2),即标准正态分布的核。从统计直觉上,大样本意味着对总体标准差的估计越来越精确,因此使用t分布与使用正态分布的差异逐渐消失。本工具可以直观展示这一收敛过程。

卡方分布的自由度k代表独立标准正态分量的个数。例如,从正态总体中抽取n个观测值,其标准化离差平方和服从自由度为n的卡方分布;若使用样本均值代替总体均值,则自由度减少为n-1。直观上,每使用一个估计量就消耗一个自由度。

选择指南:①单样本均值检验(σ未知)→t分布;②分类数据检验→卡方分布;③多组均值比较→F分布(ANOVA);④大样本比例/均值(σ已知或n很大)→正态分布。实际应用中需结合样本量、数据类型和研究设计综合考虑,必要时通过模拟验证。