无需登录 数据私有 本地保存

统计计算器 - 均值/中位数/方差/标准差

16
0
0
0

统计计算器

均值 · 中位数 · 方差 · 标准差 · 四分位数 — 一站式统计分析

已解析:0 个数据点
输入数据后将在此显示解析预览...
均值
中位数
标准差(s)
极差
IQR
总和
计数
最小值
最大值
众数
Q1
Q3
方差(总体)
方差(样本)
标准差(总体)
变异系数
数据分布可视化(排序条形图)

输入数据后将在此显示可视化图表

常见问题与统计知识点

均值(Mean),通常指算术平均数,是所有数据值的总和除以数据个数。公式为:x̄ = Σxᵢ / n。均值是最常用的集中趋势度量,反映数据的"重心"位置。但它对异常值(极端值)非常敏感——一个特别大或特别小的值就可能显著改变均值。

中位数(Median)是将数据排序后位于中间位置的值,它将数据集分为上下两半。与均值不同,中位数不受极端值影响,是稳健的集中趋势度量。

使用建议:当数据呈偏态分布或存在异常值时(如收入数据、房价数据),中位数通常比均值更能代表"典型值"。例如,一组薪资数据中如果包含一位高管的薪资,均值会被拉高,而中位数更能反映普通员工的薪资水平。当数据呈近似正态分布时,均值和中位数接近,两者均可使用。

方差(Variance)是各数据点与均值之差的平方的平均值,衡量数据的离散程度。其单位是原始数据单位的平方(如"分的平方"、"米的平方"),这在实际解读时不够直观。

标准差(Standard Deviation)是方差的平方根,与原始数据单位相同,因此更易于理解和解释。例如,考试成绩的标准差为12分,意味着大多数学生的成绩在均值±12分范围内。标准差是最广泛使用的离散度量指标。

这是一个非常关键的统计概念:
总体方差(σ²):分母使用 N(总体大小),适用于你拥有全部数据(整个总体)的情况。
样本方差(s²):分母使用 n-1(样本大小减1),适用于你只有部分数据(一个样本),并想用样本来估计总体方差的情况。

n-1 被称为贝塞尔校正(Bessel's Correction)——使用 n 会系统性地低估总体方差,而 n-1 能给出无偏估计。在实际应用中(如问卷调查、实验数据),我们通常处理的是样本数据,因此样本标准差(s)更为常用。

四分位数将排序后的数据分成四等份:
Q1(第25百分位数):25%的数据小于此值
Q2(第50百分位数,即中位数):50%的数据小于此值
Q3(第75百分位数):75%的数据小于此值

四分位距 IQR = Q3 - Q1,代表中间50%数据的分布范围。IQR 是稳健的离散度量,不受异常值影响。在箱线图(Box Plot)中,IQR 用于识别异常值——通常将低于 Q1-1.5×IQR 或高于 Q3+1.5×IQR 的值标记为潜在异常值。

标准差反映了数据围绕均值的分散程度。标准差越小,数据越集中;标准差越大,数据越分散。

经验法则(适用于近似正态分布):
• 约 68% 的数据落在均值 ±1个标准差范围内
• 约 95% 的数据落在均值 ±2个标准差范围内
• 约 99.7% 的数据落在均值 ±3个标准差范围内

例如,某次考试均分为80分,标准差为10分,则约68%的学生成绩在70-90分之间,约95%在60-100分之间。

变异系数 CV = 标准差 / 均值 × 100%,它是一个无量纲的相对离散度量,以百分比表示。CV 的独特优势在于可以比较不同单位或不同量级的数据集的变异程度。

例如:比较A班成绩(均值80,标准差12,CV=15%)和B班成绩(均值60,标准差11,CV≈18.3%),虽然A班标准差更大,但B班的相对变异更大。CV 在金融(比较不同价格股票的波动性)、质量控制、生物学研究等领域非常有用。注意:均值接近0时CV无意义。

本工具智能识别多种数据分隔格式,无需手动选择:
逗号分隔:78, 85, 92, 88
空格分隔:78 85 92 88
换行分隔:每行一个数字
制表符分隔:从Excel直接粘贴
混合分隔:78, 85 92, 88(逗号+空格混合)
支持负数和小数:-3.14, 0, 2.718
• 也支持分号、竖线等常见分隔符。系统会自动提取所有有效数字,过滤掉非数字内容。