打字猴:1.702637219e+09
1702637219 统计学的世界(第8版) [:1702629691]
1702637220 统计学的世界(第8版) 第17章 思考随机事件
1702637221
1702637222 案例分析
1702637223
1702637224 2012年2月29日,犹他州普罗沃一位女性连续第三次在同一日期生下婴儿,打破了20世纪60年代创下的纪录。美联社报道了这条消息,之后其他美国媒体也转载了这条令人惊讶的消息。如果生产日期是随机和独立的,统计学家可以证明这样的事情的发生概率大约只有30亿分之一。如此罕见使得这条消息颇具新闻价值。
1702637225
1702637226 这件事到底有多令人惊讶呢?在这一章,我们将学习如何解释30亿分之一的概率。学完这一章,你将能够评估这样的巧合事件真的像看上去的那么令人惊奇吗?
1702637227
1702637228 概率的概念
1702637229
1702637230 机会是难以捉摸的,让我们从考虑“如果我们这样做许多次,将会发生什么事情”开始。在我们思考更复杂的情况之前,可以先从抛一枚硬币,猜测会出现正面还是反面入手。
1702637231
1702637232 即便是美式橄榄球比赛规则也认为,抛硬币可以避免偏袒行为。抽样调查挑选调查对象时,或者医学临床试验将病人分配到处理组或安慰剂组时,如果有偏袒,就像美式橄榄球比赛开始时决定球先给哪一队时有所偏袒一样,都是不能接受的。这就是为什么统计学家建议使用随机样本与随机实验,这些都是抛硬币的花哨版本。如果我们仔细观察抛硬币或者随机抽样的结果,一个重要事实就会浮现出来:短期随机现象无法预测,但是长期下来,会呈现出有规则且可预测的模式。
1702637233
1702637234 抛一枚硬币或者选择一个简单随机样本,都无法在事前预测结果;因为如果你重复掷硬币或选样本,结果就会次次不同。但还是可以在结果里面看到某种规则的模式,只有在重复许多次以后,这个模式才会清晰地浮现出来。这个了不起的事实,就是概率概念的基础。
1702637235
1702637236 例1 抛硬币
1702637237
1702637238 当你抛一枚硬币的时候,结果只有两种可能:正面朝上或反面朝上。图17-1显示了抛硬币1000次的结果。在这1000次投掷中,将正面朝上的比例画在图上。第一次的结果是正面朝上,所以正面朝上的比例是1,第二次是反面朝上,此时正面朝上的比例降为0.5。再接下去的4次,是1次正面朝上和3次反面朝上,所以6次投掷后正面朝上的比例是2/6,也就是0.333。
1702637239
1702637240 开始时正面朝上的比例变化很大,随着投掷的次数增多,这个比例会逐渐稳定下来,靠近0.5,而且会维持在0.5附近。我们把0.5称为正面朝上的概率,并用一条水平线将它表示出来。
1702637241
1702637242 统计学里的“随机性”并不是“偶然性”的同义词,而是在描述某种长期下来才会出现的规则。我们在每一天的生活中,都会碰到随机性不可预测的那一面,但我们很少有机会能重复观察同一个随机现象许多次,而且次数多到能够看出规则或模式。你可以在图17-1中看到规则的出现,从长期来看,正面朝上的比例是0.5,这是概率的直觉概念。概率为0.5表示“在尝试多次的情况下,有一半的可能性会发生”。
1702637243
1702637244
1702637245
1702637246
1702637247 图17-1 抛硬币许多次,正面朝上的比例随着我们投掷的次数而改变,但最终会非常接近0.5,这就是我们说的“正面朝上的概率是一半”的意思
1702637248
1702637249 我们可能仅仅因为硬币只有两面,就会猜正面朝上的概率是0.5。但是,婴儿的性别也只有两种可能,概率却不一样——生男婴的概率差不多是0.51,而不是0.50。概率的概念源自经验法则,也就是说,是根据数据而不是根据理论得来的。概率描述在重复多次后会发生什么情况,我们必须真的观察许多次抛硬币的结果或许多的婴儿,才能够了解这个概率。说到抛硬币,有些勤快的人还真的投掷过成千上万次硬币呢。
1702637250
1702637251 例2 抛硬币的人
1702637252
1702637253 法国自然科学家布冯伯爵将一枚硬币抛了4040次,结果有2048次正面朝上,即正面朝上的比例为2048/4040=0.5069。
1702637254
1702637255 大约在1900年,英国统计学家卡尔·皮尔逊竟然抛了24000次硬币,结果有12012次正面朝上,比例为0.5005。
1702637256
1702637257 南非数学家约翰·克里奇在第二次世界大战期间被关在监狱里,他抛了10000次硬币,结果有5067次正面朝上,比例为0.5067。
1702637258
1702637259 随机与概率
1702637260
1702637261 如果一个现象的个别结果无法预测,然而在多次重复之后,其结果会呈现出规则的分布,我们就称该现象为随机现象。
1702637262
1702637263 一个随机现象的任一结果的出现概率是在0~1之间的一个数字,该数字描述在重复多次的情形下某个结果出现的比例。
1702637264
1702637265 概率为0的结果从来都不会发生,概率为1的结果则每重复一次就发生一次。概率为1/2的结果,在多次重复的情况下,大约有一半时间会发生。当然,我们永远没办法实际观察出一个概率,比如,硬币不管抛了多少次都可以再抛。数学中的概率是一种理想化的描述,预测的是在无休止重复的情况下某结果发生的可能性。
1702637266
1702637267 我们不想在这里做深入的研究。随机现象的存在,只不过是我们观察这个世界所得到的事实,概率也只是用来描述随机现象长期规律性的语言。抛一次硬币的结果、放射源发射出粒子的间隔时间,以及实验室老鼠生的下一胎小老鼠的性别都是随机的。随机样本或者随机实验的结果也是随机的。一大群人的行为,常常和抛多次硬币或取多个随机样本的结果一样充满随机性。举例来说,人寿保险根据的就是在一大群人里面死亡是随机发生的事件这个事实。
1702637268
[ 上一页 ]  [ :1.702637219e+09 ]  [ 下一页 ]