第一节 直线回归
(1)
(2) (3) (4)
(5) (6) (7)
(8) (9)
一、直线回归的概念
直线回归(linear regression)是描述两个变量间依存关系的一种统计分析方法。此法又称简单回归(simple
regression)。此法通过直线回归方程(linear regression equation)描述一个变量Y[常称为应变量(dependent
variable)]依存另一个变量X[常称为自变量(independent variable)]变化的数量关系。由此方程可确定一条回归直线。
二、直线回归方程的求法
直线回归方程的表达式为
公式(13.1)
式中X为自变量,为应变量Y的估计值,a
为回归直线在Y轴上的截距(intercept),b为回归系数(regression coefficient),也即回归直线的斜率(slope)。根据数学上的最小二乘法的原理计算a和b
。计算公式如下:
公式(13.2)
式中分别表示离均差平方和与离均差积和。
公式(13.3)
最小二乘法原理的含义是保证各实测点至直线的纵向距离的平方和最小。
例13.1 某研究者为探讨女性的年龄与收缩压的关系,收集了某地12名妇女的年龄与收缩压数据见下表13-1的(2)、(3)。试求年龄与收缩压的直线回归方程。
|
|