2    参数的区间估计

一.数学概念与定义

    1.置信区间

       设总体的分布中含有一个未知数是来自总体的样本。如果对于给定的数值,统计量满足

               

   则称随机区间的置信度为的置信区间,发别称为置信下限与置信上限。

    2.单侧置信区间

   设总体的分布中含有未知参数的样本,。若统计量满足

   则称随机区间的置信度为的单侧置信区间,称为的置信度为的置信下限。

   又若统计量满足

   则称随机区间置信度为的单侧置信区间,称为的置信度为的置信上限。

二.原理公式和法则

   求未知参数的置信区间的一般方法:

     1° 对于给定的样本,构造一个样本的函数

       它包含待估参数,而不含其它未知参数,并且的分布已知,在的分布中不依赖任何未知参数;

     2° 对于给定的置信,定出两个常数(一般地,按所服从的分布上的分位点来确定),使

     3° 得到等价的不等式,其中都是统计量,于是得到的一个置信度为的置信区间为

. 重点、难点分析

    本节的重点是理解区间估计的概念。

    先看未知参数点估计和区间估计有何异同?

    未知参数点估计就是将样本观察值代入估计量中,得到一个数值,作为真值的近似值。尽管点估计值随样本观察值的不同而异,但它能给人们一个具体的数值,因而在实际中常常使用点估计对客观事物作出某种推断。但作为一个近似值,它与真值间总有偏差,其偏差范围不知道。也就是说,这种推断的精确度如何?可靠性有多大?点估计本身并没有告诉我们,这正是点估计的不足之处。在实际中,人们希望对的取值估计出一个范围,并希望知道这个范围包含参数真值的可靠性程度,这样的范围通常用区间的形式给出,这种形式的估计弥补了点估计的不足。

    故点估计区间估计都用样本的统计量对未知参数的值进行估计。不同的是点估计得到的是未知参数物近似值,而区间估计得到的是以一定概率包含未知参数真值的范围。

    再讨论置信区间中提到的概率

    首先与一般概率的含义有所不同。后者区间为确定一个数值区间,为随机变量,它表示的取值落在区间内的概率为。而式中的区间是随机区间,是客观存在的一个未知常数值,它的含义是随机区间包含未知常数的概率是

    另一方面,我们还希望估计的精确度高。

    区间估计就是寻找种种方法,以构造出具有较高的可靠性和精确度的敬意,但是,当样本容易固定不变时,置信区间的可靠性越高(即越大),区间估计的精确度就越差,(即区间长度就越长),所以,在固定时,置信区间的可靠性和精确度是相互制约的,不可能同时将两者提高到任意的高度,从置信区间的结构可以看出。增大样本容量,可缩短置信区间的长度。求置信区间,实际上是在保证可靠性达到指定水平,犯错误的概率控制在这内的前提下,尽可能地提高精确度。