第三章 数据分布特征的测度
第二节
离散和程度的测度
<三>定距和定比数据:方差及标准差
测度定距和定比数据离散程度方法主要有极差、平均值、方差和标准差,其中最常用的是方差和标准差。
1.极差
极差( Range )也称全距,是一组数据的最大值和最小值之差,
,式4-13
式中, R 为级差; maxmin 分别为一组数据的最大值和最小值。对于组距分组数据,极差也可以近似表示为 R =最高组上限值-最低组下限值。
极差是描述数据离散程度的最简单测度值,计算简单,易于理解,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。
2.平均差
平均差( Mean deviation )也称平均离差,是各变量值与其均值离差绝对值的平均数,用 MD 表示。根据未分组数据计算平均差的公式为:
,式4-14
根据组距分组数据计算平均差的公式为:
,式4-15
平均差以均值为中心,反映了每个数据与均值的平均离差程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之,则说明数据的离散程度越小。但为了避免离差之和等于 0 而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这给计算带来了不便。同时平均差在数学性质上不是最优的,因而实际中应用较少。