第三章 数据分布特征的测度
第二节
离散和程度的测度
b. 样本方差和标准差。样本方差与总体方差在计算上的区别是:总体方差是用数据个数或总频数去除离差平方和,而样本方差则是用样本数据个数或总频数减 1 去除离差平方和,其中样本数据个数减 1 即 n-1 称为自由度( Degree of freedom )。设样本方差为 Sn-1 ,根据未分组数据和组距分组数据计算样本方差的公式 分别为:
,式4-20~式4-23
当 n 很大时,样本方差 S2n-1 与总体方差 σ2 的计算公式结果相差很小,这时样本方差也可以用总体方差的公式来计算。
为什么样本方差是用自由度 n-1 去除呢?从字面含义来看,自由度是指一组数据中可以自由取值的个数。当样本数据的个数为 n 时,若样本均值 X 确定后,只有 n-1 个数据可以自由取值,其中必有一个数据不能自由取值。从实际应用的角度看,在抽样估计中,当我们用样本方差 Sn-2 去估计总体方差 σ2 时,它是 σ2 的无偏估计量。
方差和标准差也是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此它能准确地反映出数据的离散程度。与平均差相比,方差在数学处理上是通过平方消去离差的正负号,更便于数学上的处理。因此,方差和标准差是实际中应用最广泛的离散程度测度值。