打字猴:1.702638919e+09

1702638919

1702638920 当总体参数的值为p时，有95%的样本统计量的值落在p值往左右各延伸两个标准差的区间内。

1702638921

1702638922 上面说的区间是：

1702638923

1702638924

1702638925

1702638926

1702638927 这是不是我们要的95%置信区间呢？不能肯定。这个区间没有办法根据样本数据算出来，因为标准差公式里有总体参数p，而实际上我们并不知道p的值。在例2里我们把p=0.12代入该公式，但这并不一定是p的真实值。

1702638928

1702638929

1702638930 我们应该怎么办呢？样本统计量的标准差的确是由p值决定的，然而当p值改变时，标准差的值并不会改变太多。我们回到例2，计算对应其他p值的标准差。

1702638931

1702638932 算出的结果如下：

1702638933

1702638934

1702638935

1702638936

1702638937

1702638938

1702638939 由此可以看出，如果我们的估计p值比较接近真实的p值，用估计值算出来的标准差就会是大致正确的。当我们取的样本很大时，统计量的值几乎总是很接近参数p的值。所以，我们可以用值当作p值，便有了一个可以根据样本数据算出来的区间。

1702638940

1702638941 样本统计量的95%置信区间

1702638942

1702638943

1702638944

1702638945 从一个成功比例p未知的总体中抽取一个大小为n的简单随机样本，这个样本的统计量叫作。那么，的一个近似的95%置信区间为：

1702638946

1702638947

1702638948

1702638949

1702638950 例3 酗酒人数比例的置信区间

1702638951

1702638952

1702638953 BRFSS随机抽取了6911名加州大学生，发现其中有792人在2010年有过酗酒经历，样本统计量=0.115。抽样统计量的95%置信区间是：

1702638954

1702638955

1702638956

1702638957

1702638958 这个结果可以这样解释：我们得到这个区间的方法若用于所有样本，就会有95%的样本统计量的值接近于未知的真实总体比例。简单地说，就是我们有95%的把握认为这个真实比例在10.74%到12.26%之间。

1702638959

1702638960 练习

1702638961

1702638962 21.1 赌博。2011年5月盖洛普抽样调查访问了一个包含1018名美国成年人的样本，发现有31%的人认为赌博是不道德的。计算全体美国成年人中，认为赌博是不道德的人所占比例的95%置信区间。你怎样解释这个结果？

1702638963

1702638964 了解置信区间

1702638965

1702638966 总体真实比例的95%置信区间有我们熟悉的形式：

1702638967

1702638968 估计值±误差范围

[ 上一页 ] [ :1.702638919e+09 ] [ 下一页 ]