打字猴:1.702637619e+09
1702637619 掷两个色子是在赌场里输钱的一种很常见的方式。当我们掷出两个色子时,依序(第一个色子,第二个色子)记录朝上那一面的点数,会出现36种可能的结果。图18-1展示了这些结果,我们应该怎样分配这些结果的概率呢?
1702637620
1702637621
1702637622
1702637623
1702637624 图18-1 掷两个色子的36种可能的结果
1702637625
1702637626 赌场的色子是精心制作的。为使每一面都一样重,有点的地方并不是凹进去的,而是用白色塑料填平。而且,白色塑料的密度和用来制作色子的红色塑料的密度相同。对于赌场的色子,为图18-1中的每一种结果分配一样大的概率是合理的。因为这36个概率的和必须是1,所以每种结果的概率必定是1/36。
1702637627
1702637628 我们感兴趣的是两个色子朝上一面的点数之和。这个和为5的概率有多大?“掷出5点”这个事件包含4种结果,其概率为这4种结果的概率之和:
1702637629
1702637630
1702637631
1702637632
1702637633 练习
1702637634
1702637635 18.1 掷色子。假设你掷出两个赌场色子,如例2,那么朝上一面的数字之和为7的概率有多大?和为11的概率有多大?和为7或11的概率有多大?
1702637636
1702637637 概率规则只告诉我们哪些概率模型有意义,并没有说概率的分配是否正确,是不是真能描述长期情况。例2中的概率对赌场色子来说是正确的。点的部分被挖空的便宜色子的各面并不平衡,因此例2的概率模型不能描述这类色子的投掷情况。
1702637638
1702637639 那么,个人概率又如何呢?由于它们是个人概率,所以你怎么定都可以吗?如果你的个人概率不符合概率规则的第一条和第二条,而你却坚持己见,我们虽然不能说你不对,但可以说它们是不相干的。也就是说,没有合理的方式可以把它们放在一起考虑。所以,我们通常坚持,对某一随机现象的所有结果分配的个人概率,必须符合概率规则的第一条和第二条。也就是说,概率规则对两种概率都适用。例如,如果你个人认为某三支球队赢得第47届超级碗冠军的概率都是0.4,那么你的个人概率并不符合概率规则。
1702637640
1702637641 抽样的概率模型
1702637642
1702637643 从总体中抽取随机样本,并计算样本统计量,当然属于随机现象。样本统计量的分布告诉我们,它可能的值有哪些,以及每个值出现的概率。这听起来非常像概率模型。
1702637644
1702637645 例3 样本统计量的分布
1702637646
1702637647 抽取一个2527位成年人的随机样本,问他们是否支持关于只承认异性婚姻合法的宪法修正案。支持者的比例是:
1702637648
1702637649
1702637650
1702637651
1702637652
1702637653
1702637654 这就是我们的样本统计量。重复这个步骤1000次,可以得到1000个样本,算出1000个样本统计量。图18-2的直方图展示的是,当总体中有50%的人支持这项宪法修正案时1000个样本统计量的分布。随机抽样的结果当然是随机的:我们无法预知一个样本的结果,但从图上可以看出,当许多样本的结果放在一起时,它们呈现出规则的形态。
1702637655
1702637656
1702637657
1702637658
1702637659 图18-2 在一个有50%的人会给出肯定回答的总体中,抽取大小为2527的简单随机样本,所得样本统计量的分布。直方图呈现的是1000个样本统计量的分布,正态分布曲线是描述很多个样本所得结果的理想化形态
1702637660
1702637661 我们曾在第13章见过图18-2,事实上,早在第3章和第11章我们就已经见过这样的直方图了。这提醒我们,重复随机抽样的规则形态是一个重要的统计学概念。图中的正态分布曲线是直方图的一个很不错的近似值。这个直方图是1000个简单随机样本的结果,可以将正态分布曲线视为我们不停地从这个总体中抽取简单随机样本所得到的理想形态。这就是概率的概念,表示我们在长期内将会看到的形态。正态分布曲线为样本统计量分配了概率。
1702637662
1702637663
1702637664 这条正态分布曲线的平均数是0.5,标准差大约是0.010。68-95-99.7规则中的“95”指的是,所有样本当中有95%的样本统计量会落在平均数左右两个标准差的范围内,也就是0.48~0.52之间。对于这个事实,我们可以用更准确的语言表达:一个样本中有48%~52%的人回答“是”的概率是0.95。
1702637665
1702637666 从一个很大的样本算出来的统计量,会有非常多的可能值。给每一个可能的结果分配概率,对于年轻女性的4种婚姻状况或者掷两个色子的36种结果来说都没问题,但是,在可能的结果有几千种的情况下就不太现实了。于是,例3用正态分布曲线下方的面积,给区间形式的结果分配概率。密度曲线下方的面积是1,这一点和总概率为1刚好呼应。图18-2中正态分布曲线下方的总面积为1,在0.48和0.52之间的面积是0.95,这就是一个样本所得结果会落入该区间的概率。当用正态分布曲线计算概率时,你可以用68-95-99.7规则来算,也可以用表B中的正态分布百分位数。这些概率都符合概率规则。
1702637667
1702637668 抽样分布
[ 上一页 ]  [ :1.702637619e+09 ]  [ 下一页 ]