第 2 节 参数的区间估计
一.数学概念与定义
1.置信区间
设总体的分布中含有一个未知数
,
是来自总体
的样本。如果对于给定的数值
,统计量
满足
则称随机区间是
的置信度为
的置信区间,
与
发别称为置信下限与置信上限。
2.单侧置信区间
设总体的分布中含有未知参数
为
的样本,
。若统计量
满足
则称随机区间为
的置信度为
的单侧置信区间,
称为
的置信度为
的置信下限。
又若统计量满足
则称随机区间为
置信度为
的单侧置信区间,
称为
的置信度为
的置信上限。
求未知参数的置信区间的一般方法:
1° 对于给定的样本,构造一个样本的函数
它包含待估参数,而不含其它未知参数,并且
的分布已知,在
的分布中不依赖任何未知参数;
2° 对于给定的置信,定出两个常数
(一般地,按
所服从的分布上的
分位点来确定),使
3° 从得到等价的不等式
,其中
与
都是统计量,于是得到
的一个置信度为
的置信区间为
。
三. 重点、难点分析
本节的重点是理解区间估计的概念。
先看未知参数点估计和区间估计有何异同?
未知参数点估计就是将样本观察值代入估计量
中,得到一个数值
,作为真值
的近似值。尽管点估计值随样本观察值的不同而异,但它能给人们一个具体的数值,因而在实际中常常使用点估计对客观事物作出某种推断。但作为一个近似值,它与真值间总有偏差,其偏差范围不知道。也就是说,这种推断的精确度如何?可靠性有多大?点估计本身并没有告诉我们,这正是点估计的不足之处。在实际中,人们希望对
的取值估计出一个范围,并希望知道这个范围包含参数
真值的可靠性程度,这样的范围通常用区间的形式给出,这种形式的估计弥补了点估计的不足。
故点估计区间估计都用样本的统计量对未知参数的值进行估计。不同的是点估计得到的是未知参数物近似值,而区间估计得到的是以一定概率包含未知参数真值的范围。
再讨论置信区间中提到的概率
首先与一般概率
的含义有所不同。后者区间
为确定一个数值区间,
为随机变量,它表示
的取值落在区间
内的概率为
。而
式中的区间
是随机区间,
是客观存在的一个未知常数值,它的含义是随机区间
包含未知常数
的概率是
。
另一方面,我们还希望估计的精确度高。
区间估计就是寻找种种方法,以构造出具有较高的可靠性和精确度的敬意,但是,当样本容易固定不变时,置信区间的可靠性越高(即
越大),区间估计的精确度就越差,(即区间长度就越长),所以,在
固定时,置信区间的可靠性和精确度是相互制约的,不可能同时将两者提高到任意的高度,从置信区间的结构可以看出。增大样本容量,可缩短置信区间的长度。求置信区间,实际上是在保证可靠性达到指定水平
,犯错误的概率控制在
这内的前提下,尽可能地提高精确度。