第一节 数值变量的频数分布
(1) (2)
(3)
分布(distribution)是一个统计概念。
分布在生活、医学等上的理解是很具体的。如绿化地带在城市中的分布;血液中红细胞的分布;某种疾病的发病部位在人体中的分布;某班全体学生的考试成绩的分布等。
分布上升到数学上,就被抽象起来。抽象的目的在于概括具体。
我们以后要学习很多统计的分布理论,如正态分布、t分布、二项分布、Poisson分布等等。我们正是利用统计分布的理论方法来揭示具体事物的内在联系和变化规律。
频数分布表(frequency distribution table)通过变量值分布在其取值范围内各组段中的频数大小来揭示具体资料的分布规律。
了解资料的分布规律对于我们选择合理的统计方法来分析资料大有帮助。
一、频数分布表
频数分布表的编制步骤:
1. 计算全距 全距(range)亦称极差,用R表示,R=最大值-最小值。
2. 确定组距和组段 组距即组段间隔数,用i表示。常取全距的1/10取整作为组距。
组段即由组距分隔的区间,每个组段的起点称下限,终点称上限。每个组段规定为: [下限,上限
)
要求第一组段包含最小值,最后组段包含最大值;一般划分8~15个组段为宜。
3. 列表划记计频 采用划记法把全部原始数据划归到每个组段中,以频数统计。
划记法可采用划“正”字法或划“ ”法,最后统计出每个组段的笔画总数即得频数。以下是教材例10.1数据的频数分布表。 |
|