第三章 统计数据的整理和显示
第三节 数值型数据的整理与显示
4. 开口组
分组中,如果全部数据中的最大值和最小值与其他数相差悬殊,为避免出现空白组(即没有变量值的组)或个别极端值被漏掉,第一组和最后一组可以采取“ XX 以下”及“ XX 以上”这样的开口组。开口组通常以相邻组的组距作为其组距。例如,<{#imeinline} class="title14xp">例子3-2假定将最小值改为 94 ,最大值改为 160 ,采用上面的分组就会出现“空白组”,这时可采用开口组,见下表
表3-6
5. 等距分组和不等距分组
等距分组。在组距分组时,如果各组的组距相等则称为等距分组,如上面的几种分组就是等距分组。等距分组由于各组的组距相等,各组频数的分布不受组距大小的影响,它同消除组距因素影响的频数密度(即单位组距内分布的特征和规律,也称次数密度)的分布是一致的,因此可直接根据绝对频数来观察频数分布的特征和规律。
不等距分组。各组组距不等的组距分组称为不等距分组。不等距分组因各组组距不同,各组频数的分布受组距大小不同的影响,因此各组绝对频数的多少并不能反映频数分布的实际情况。为消除组距不同对频数分布的影响,需要计算频数密度,即 频率密度 = 频率 ÷ 组距 。频数密度能准确反映频数分布的实际情况。
6. 组中值
组距分组掩盖了各组内的数据分布状况,为反映各组数据的一般水平,我们通常用组中值( Class midpoint )作为该组数据的一个代表值,即 组中值 = (上限 + 下限)÷ 2 。但这种代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两侧呈对称分布。如果实际数据的分布不符合这一假定,用组中值作为一组数据的代表值会有一定的误差。