您现在的位置 | 步进教学 | 第三章 | 第三节 | 第3页 (共6页)
 
绪论
统计与统计学
统计学的分科
统计学与其它学科关系
统计数据的搜集
数据的计量与类型
统计数据的来源
调查方案设计
统计数据的质量
统计数据整理和显示
数据的预处理
品质数据的整理与显示
数值型数据整理与显示
统计表
集中趋势的测度
离散和程度的测度
偏态和峰度的测度
时间序列分析
时间序列的对比分析
长期趋势分析
 指数
指数编制的基本问题
加权指数
指数体系
 

 

第三章 统计数据的整理和显示

第三节 数值型数据的整理与显示


4. 开口组
分组中,如果全部数据中的最大值和最小值与其他数相差悬殊,为避免出现空白组(即没有变量值的组)或个别极端值被漏掉,第一组和最后一组可以采取“ XX 以下”及“ XX 以上”这样的开口组。开口组通常以相邻组的组距作为其组距。例如,<{#imeinline} class="title14xp">例子3-2假定将最小值改为 94 ,最大值改为 160 ,采用上面的分组就会出现“空白组”,这时可采用开口组,见下表


表3-6

5. 等距分组和不等距分组

•  等距分组在组距分组时,如果各组的组距相等则称为等距分组,如上面的几种分组就是等距分组。等距分组由于各组的组距相等,各组频数的分布不受组距大小的影响,它同消除组距因素影响的频数密度(即单位组距内分布的特征和规律,也称次数密度)的分布是一致的,因此可直接根据绝对频数来观察频数分布的特征和规律。

•  不等距分组各组组距不等的组距分组称为不等距分组。不等距分组因各组组距不同,各组频数的分布受组距大小不同的影响,因此各组绝对频数的多少并不能反映频数分布的实际情况。为消除组距不同对频数分布的影响,需要计算频数密度,即 频率密度 = 频率 ÷ 组距 。频数密度能准确反映频数分布的实际情况。

6. 组中值
组距分组掩盖了各组内的数据分布状况,为反映各组数据的一般水平,我们通常用组中值( Class midpoint )作为该组数据的一个代表值,即 组中值 = (上限 + 下限)÷ 2 。但这种代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两侧呈对称分布。如果实际数据的分布不符合这一假定,用组中值作为一组数据的代表值会有一定的误差。

 
     
  1 2 3 4 5 6  
 

吉林大学远程教育学院◎版权所有_2004