第二节 科研资料的统计学分析
一、统计学的相关概念
1.概率
是描述随机事件发生可能性大小的一个度量,也称机率。统计上用符号P表示。
投掷一枚硬币,其落地出现哪一面是一个随机事件。若做一个投币实验,共投50次,概率是硬币未投之前应知道的某面可能出现的强度数值。我们都知道,投掷一枚硬币,其落地出现某一面的概率是0.5 (=1/2)。
概率
用P表示,其值介于0到1之间。P越接近1,表示该事件发生的可能性越大,反之越小。 P=1为必然事件,P=0为不可能事件。
小概率事件
是指P≤0.05或P≤0.01的事件。若小概率事件出现,我们认为不发生。
统计学中根据概率的原理将P≤0.05和P≤0.01看作是事物差别有统计学意义和高度统计学意义的界限。
2.假设检验
在实际抽样研究中,当由两抽样群体所计算得到的某指标的均数发生差异时,要明确这种差异是由于抽样误差所致还是由于两者有本质差异,即是否来自于同一总体,还是来自两个不同的总体,就需通过假设检验来回答这个问题。
假设检验是应用统计学的原理由样本之间的差别去推断样本所代表的总体之间是否有差别的一个重要推断方法。
假设检验步骤:
- 建立假设
- 确定显著性水平
- 计算统计量
- 确定概率值p
- 做出推断结论
二、科研资料的类型
计量资料:用测量方法获得数据,对各观察单位用定量方法测定某项指标量的大小,这类资料一般有度量衡等单位。
计数资料:将全体观察单位,按照某种性质或特征分组,再分别清点各组中观察单位的个数,这样得到的数据资料,就是计数资料。计数资料没有度量衡单位,且均为整数。
等级资料:又称半定量资料,是介于计量资料和计数资料之间的一种资料。将全体观察单位按照某种性质的不同程度分成若干组,再分别清点各组中观察单位的个数,这样得到的数据资料就称为等级资料。
根据统计分析的需要,计量资料、计数资料和等级资料可以相互转化。
三、常用的统计学分析方法
统计分析可分为统计描述和统计推断。
统计描述是指用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述,不涉及由样本推论总体问题。
统计推断是指如何由样本信息推断总体特征问题。
在对所获取的资料进行统计分析时,一定要先明确资料的类型,然后根据资料的类型和研究目的选用相应的统计学方法。
某护师随机抽取10名健康女大学生,在午饭后休息1小时,测试口腔温度,体温表分别在口腔中放置4分钟和7分钟,测试结果见表。试比较两种放置时间测试结果是否相同?
某地某年男女肺癌患者的起病年龄的均数和标准差如下,试问能否说男性患该病的起病年龄要早于女性?
某卫生局考核各医院护士的基本水平,在甲、乙医院随机抽出护士100人进行考试,甲院参加考试者共38人,合格28人;乙院参加考试者共62人,合格30人。计算甲、乙医院护士的基础护理操作合格率有无差别。
四、统计表和统计图
统计表和统计图在护理研究论文中应用普遍。一个编制合理的统计表或统计图可以代替冗长的文字叙述,不仅便于阅读,而且利于数据的分析比较。
(一)统计表
1.结构和编制要求
统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。
统计表由文字、数字和线条等组成,表上边的文字为标题,表内的文字是标目,又有纵标目、横标目之分,横、纵标目相交叉的右下方,占表的绝大部分是数字,表的线条以三条线为主,即顶线、底线与分界线。
统计表分为简单表,组合表。
简单表是按一种特征分类的统计表。
组合表是将两种或两种以上的特征结合起来作为分组的标志的统计表。
统计表在绘制过程中也有一定要求,总的原则是以最少的篇幅,显示出最多的信息。因此绘制统计表一是要重点突出,简单明了,每一表格说明一个中心问题为宜,避免绘制企图包罗万象的大表,使表格臃肿;二是要层次清楚,表内项目排列合理,便于阅读和分析比较。
统计表的具体要求:
- 表号和表题:每个表均应有相应的表号和表题,写在表的上方中央,表题应扼要说明表的主要内容。
- 标目:无论横标目还是纵标目,凡内容有计量单位者均应注明,同时要注意法定计量单位的正确使用。标目应循顺序排列。横标目的内容一般自上而下、从小到大排列,如年龄组。纵标目的内容一般从左向右由小到大排列。
- 线条:统计表中只有横线,无竖线和斜线。简单表一般是三线表,而组合表在总标目和各纵标目之间,以及最后一行数字和合计之间,应该有一条横线。
- 数字:一律用阿拉伯数字表示,同一列的数字位数应一致,位次对齐。表格中不应有空格,暂无记录或未记录用“…”表示,无数据用“—”表示,这两种情况都不能填“0”。
- 备注:不列入表内,特殊情况须用备注说明时,可用“﹡”等符号标出,写在表的下面。
(二)统计图
统计图是用图形将统计资料形象化,利用线条高低、面积大小来来代表数量,通俗易懂,比统计表更便于理解与比较。因此统计图应用也很广,但从统计图中不能获得确切数字,所以不能完全代替统计表,必要时可将统计表一起列出。
绘制统计图的要求
- 根据资料性质和分析目的决定适当图形。
- 每个统计图均应有图号和图题,写在图的下方,图题应扼要地说明图的内容。
- 在横轴下方和纵轴外侧必须用文字标明纵横轴各自代表的涵义,如有单位应注明。
- 纵轴和横轴上要有刻度和单位,刻度要均匀等距(半对数线图的纵坐标除外),并标明数值。
- 横轴尺度自左至右,纵轴尺度自上而下,数值一律由小到大。一般纵轴尺度必须从0点起始(对数图、点图等除外)。
- 图中用不同线条或色调代表不同事物时,需用图例说明。
- 图的长宽比例一般以7:5左右较合适,比例太大或太小都不合适。
圆图与百分条图
条图
等宽直条表示相互独立的指标,直条长短表示指标的大小。直条图分单式直条图和复式直条图。
线图
以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况,适用于连续性资料。
直方图
由一些紧密相连的直条组成,主要用于表示连续变量的频率分布,不是以条的高度而是以各矩形的面积代表各组段的频数和数量的大小,适用于连续性数量资料。
散点图
是以点的密集程度和趋势来表示两种现象的相互关系。
五、计算机软件SPSS和SAS的应用
计算机为需要高速、准确、灵活地进行大量数据分析的科研提供可能。
两大统计软件包括SAS(statistical analysis system)和SPSS(statistical package for the social sciences),均涵盖基本统计功能。
SAS的主要优点:
功能强大,在分析理论应用方面较为严谨,涵盖各种高级统计功能,并能显示数据处理的中间过程。
SPSS即社会科学统计程序包。
主要优点:命令简单。理论严谨,内容丰富,提供联机求助和软件辅助教学功能,帮助功能强,要求记忆的内容少,适合非计算机专业的统计分析人员使用。
SPSS是当今世界上最权威的统计分析系统之一。SPSS于上世纪七十年代初由美国的Stanford大学的一个研究小组开发,以后成立SPSS公司专门负责产品的研制、生产、销售和培训。SPSS最初是为大型计算机开发的,随着PC的发展与普及,相应地推出PC版本,以后相继推出升级版本,功能不断加强,目前最新版本为SPSS V13.0。
SPSS公司已于2000年正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。
SPSS是一个模块化、集成化的应用软件系统。它通过基本模块BASE与其它模块相连,完成各种不同的统计分析任务。
SPSS最突出的特点就是操作界面极为友好,输出结果美观漂亮,它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。
SPSS是非专业统计人员的首选统计软件。
SPSS
是世界上最早采用图形菜单驱动界面的统计软件。它采用类似Excel表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计方法,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储为专用的SPO格式,可以转存为HTML格式和文本格式。
SPSS的启动和操作界面
启动SPSS有两种方法:一是通过双击桌面上的SPSS的快捷启动方式图标 ;二是通过单击“开始”按钮内“程序”下SPSS系统程序组中的SPSS的启动程序项 。
SPSS的操作界面是由标题、菜单、工具栏、窗口和状态行构成。不同版本的界面稍有不同。
SPSS 10.0的数据管理界面。
分析结果的操作界面。
SPSS的基本使用方法
与SAS不同,SPSS主要通过操作菜单来完成统计分析任务。
SPSS把所有的统计分析功能分门别类地以命令、对话框和选择项的形式放到菜单中。用户使用统计功能只需点击鼠标就可轻松完成,而不必费心编程。SPSS还提供了通过“粘贴”按钮自动生成程序内容的先进、方便功能。
SPSS也必须首先建立数据集才可进行统计分析。通过在一个类似Excel表格的界面里建立包括变量在内数据文件。
掌握新软件的最快的方法是通过应用SPSS软件具体分析一个或几个事例,在应用中进行学习和熟练,但在使用过程中应注意的一点是使用者必须对所选用的统计分析方法的适用条件有所了解,并对结果进行正确筛选,以保证统计软件方法和分析结果的准确性。