第四章 数据分布特征的测度
第一节
集中趋势的测度
四.均值、中位数、众数三者之间的关系
<一> 众数、中位数和均值的关系
从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而举止则是全部数据的算术平均。因此,对同一组数据计算众数、中位数和均值,三者之间具有以下关系:在单峰分布条件下,如果数据的分布是对称的,则众数( M0 )、中位数( Me )和均值( X )必定相等,即 M0=ME=X; 如果数据是左偏分布,说明数据存在极小值,必然拉动均值向极小值一方靠,而众数和中位数由于位置是代表值,不受极值的影响,因此三者之间的关系表现为: X<ME<M0 ; 如果数据是右偏分布,说明数据存在极大值,不然拉动均值向极大值一边靠,则 M0<ME<X 。

图4-3
<二>众数、中位数和均值的特点与应用场合
1 、当分布比较规则,不存在极端值比较偏离时,用算术平均数代表集中趋势是最合适的。
2 、算术平均数适用于定据或定比变量;中位数适用于定序变量;众数适用于定性变量。
3 、对分组资料来说,用算术平均数是非常合适的。
4 、算术平均数包含的信息是最多的、最丰富的,所有观测值与算术平均数差的和等于 1 ,所有观测值与算术平均数的平方和是最小的,在数学上是很容易计算的。
表4-1 列出了数据的类型和所适用的集中趋势测度值。
* ※为该数据类型最适合用的测度值
表4-1