打字猴:1.702639061e+09

1702639061

1702639062

1702639063

1702639064

1702639065 公式中的z*是表21-1中对应置信水平C的临界值。

1702639066

1702639067 例5 99%置信区间

1702639068

1702639069 BRFSS在2010年访问了一个包含6911名加州大学毕业生的随机样本，发现792人在过去一年有过酗酒经历。我们想找出所有加州大学毕业生在过去一年中酗酒人数比例的99%置信区间。在表21-1中，对应99%置信度，z*=2.58个标准差。以下是计算过程：

1702639070

1702639071

1702639072

1702639073

1702639074 我们有99%的把握认为，真实的总体比例在0.1052~0.1248之间。也就是说，我们得到这个区间的方法，在99%的时候会产生正确的结果。

1702639075

1702639076 比较例5和例3中95%置信区间的计算过程，会发现两者唯一的差别就在于，95%置信度时所用的2在99%置信度时被临界值2.58所取代。这样做导致99%置信度的误差范围较大，置信区间较宽。较高的置信度可不是免费的，代价就是较宽的置信区间。从图21-5可以看出为什么会这样。要涵盖正态曲线下方的较大面积，从中心点往两边走的距离就会远一些。

1702639077

1702639078 练习

1702639079

1702639080 21.2 赌博。2011年5月盖洛普访问了一个包括1018名美国成年人的随机样本，发现其中有31%的人认为赌博是不道德的。计算全体美国成年人中认为赌博是不道德的人数比例的99%置信区间。你怎样解释这个结果？

1702639081

1702639082 样本平均数的抽样分布

1702639083

1702639084

1702639085

1702639086 你们学校的大一新生每周用于学习的平均时间是多少？他们在高中时期的平均分数是多少？我们经常想估算总体平均数。为了区分总体平均数（一个参数）和样本平均数，我们将总体平均数记为希腊字母μ。接下来，我们用简单随机样本的平均数来估算未知的总体平均数μ。

1702639087

1702639088

1702639089

1702639090

1702639091

1702639092 和样本比例一样，一个大的简单随机样本的平均数拥有近似正态分布的随机分布。由于简单随机样本的平均值是μ的一个无偏估计值，因此的抽样分布以μ作为平均数。的标准差取决于总体的标准差，后者通常记作希腊字母σ。在数学领域中，我们可以发现以下事实：

1702639093

1702639094 样本平均值的抽样分布

1702639095

1702639096

1702639097 从一个平均数为μ、标准差为σ的总体中抽取一个样本量为n的简单随机样本，代表样本平均数。那么：

1702639098

1702639099

1702639100 • 当样本量n很大时，的抽样分布近似于正态分布。

1702639101

1702639102 • 抽样分布的平均数等于μ。

1702639103

1702639104

1702639105 • 抽样分布的标准差是σ/。

1702639106

1702639107

1702639108

1702639109 根据多个样本算出的样本平均数以总体的真实平均数μ为中心，这并不奇怪，因为随机抽样没有偏差。其他两个有关抽样分布的事实为样本平均数赋予了两个非常重要的特征：

1702639110

[ 上一页 ] [ :1.702639061e+09 ] [ 下一页 ]