无需登录 数据私有 本地保存

假设检验简易计算 - Z检验/t检验

14
0
0
0
检验参数设置


修改参数后点击计算按钮更新结果
检验结果
检验统计量
z
P 值
p-value
临界值
临界值
结论
α = 0.05
请设置参数并点击「计算」查看检验结果
常见问题与知识点
Z检验和t检验有什么区别?
Z检验适用于已知总体标准差(σ)的情况,通常需要大样本(n≥30),基于标准正态分布。
t检验适用于未知总体标准差、用样本标准差(s)估计的情况,基于t分布(自由度越小,尾部越厚)。小样本(n<30)通常使用t检验。当样本量增大时,t分布趋近于标准正态分布。
单侧检验和双侧检验如何选择?
双侧检验:当你不确定效应方向时使用,检验的是"是否有差异"(≠)。α平分到两个尾部。
单侧检验:当你明确预期方向时使用,检验的是"是否大于"或"是否小于"。全部α集中在一个尾部,检验功效更高。需在数据收集前确定,避免事后选择。
如何解读p值?
p值是在原假设H₀为真的条件下,观察到当前或更极端结果的概率。
• p < α:拒绝H₀,结果具有统计显著性
• p ≥ α:无法拒绝H₀,证据不足
注意:p值不表示效应大小,也不表示H₀为真的概率。p值小≠效应大,需要结合效应量(如Cohen's d)综合判断。
第一类错误和第二类错误是什么?
第一类错误(α错误):H₀为真时错误拒绝H₀(假阳性)。概率=显著性水平α。
第二类错误(β错误):H₀为假时未能拒绝H₀(假阴性)。概率=β,检验功效=1-β。
增大样本量可同时降低两类错误的风险。
双样本t检验中"等方差假设"是什么?
等方差t检验(Student's t):假设两组总体方差相等,使用合并方差(pooled variance),自由度=n₁+n₂-2。
Welch's t检验:不假设等方差,使用近似自由度(通常更小、非整数),更为稳健。现代统计实践推荐默认使用Welch's t检验。
可用Levene检验或F检验判断方差是否相等。
样本量对假设检验有什么影响?
样本量越大:
• 标准误越小,检验统计量越大
• 更容易检测到微小差异(统计显著性)
• t分布趋近正态分布
• 检验功效(1-β)越高
注意:大样本下,微小的实际差异也可能"显著",需结合效应量判断实际意义。
效应量(Cohen's d)是什么?
Cohen's d衡量的是组间差异的标准化大小:
• |d| ≈ 0.2:小效应
• |d| ≈ 0.5:中等效应
• |d| ≈ 0.8:大效应
与p值不同,效应量不受样本量影响,反映实际差异的大小。报告结果时应同时提供p值和效应量。
显著性水平α应该选多少?
α=0.05:最常用,平衡了假阳性与假阴性的风险
α=0.01:需要更强证据时使用(如医学研究、大规模决策)
α=0.10:探索性研究或小样本初步分析时使用
选择α应考虑研究领域惯例、错误决策的代价以及样本量。