1702637893
统计学的世界(第8版) 第19章 统计模拟
1702637894
1702637895
案例分析
1702637896
1702637897
对于赛马而言,起点位置决定了最后结果。如果起点靠近内跑道,就会占据优势。为了保证公平,赛前要抽签决定选手的起点位置。所有位置被抽到的概率是一样的,所以没人会占便宜。
1702637898
1702637899
在2007年夏秋季,俄亥俄州赛马委员会留意到一位骑手的运气似乎出奇的好。在35场比赛中,这位骑手有30次抽到了内圈的跑道。每场参赛的马匹一般是6~10匹,但大多数时候是9匹马。所以,抽到内圈三个跑道之一的概率是1/3。
1702637900
1702637901
俄亥俄州赛马委员会认为这位骑手的运气好得令人难以置信。数学家可以证明35场比赛中有30次抽中内圈跑道的概率非常小,所以委员会怀疑其中有诈。但是,这位骑手在几年里已经参加过近1000场比赛了。也许在近1000场比赛中,这位骑手也有在35场比赛中有30次抽中内圈跑道的经历。这件事之所以引起委员会的注意,是因为这种情况类似我们在第17章讨论过的令人惊奇的巧合。但是,欺诈的指控也许并不成立。
1702637902
1702637903
在1000场比赛中,每场有不同数量的马匹参赛,很难计算连续35场比赛中一位骑手抽中内圈跑道的概率。如何计算这个概率是本章的主题,学完这一章,你就会知道如何计算这个概率。
1702637904
1702637905
概率从何而来?
1702637906
1702637907
抛硬币时,正面朝上和反面朝上的概率都十分接近0.5。从原则上说,这些概率是根据多次抛硬币的数据得来的。而乔对于明年谁会赢得超级碗冠军的个人概率,却只是乔的个人判断。抛一个硬币10次,连续三次正面朝上的概率如何算呢?我们可以用描述抛硬币情况的模型,算出这个概率。也就是说,在我们根据数据建立起抛硬币的概率模型后,就不需要每次抛硬币时都重新建立概率模型。
1702637908
1702637909
使用概率模型的一大优点是,让我们先学会对一些诸如“抛一次硬币得到正面朝上的结果”的简单事件分配概率,接下来再计算一些复杂事件的概率。不论概率模型反映的是根据数据计算得到的概率还是个人概率,上面的优点都成立。但不幸的是,计算概率需要用到的数学知识往往很难。还好有科技拯救我们:只要我们有概率模型,就可以用电脑来模拟重复多次的情况。这样做比算数容易,更比在真实世界中进行多次重复实验要快得多。你可以把利用模拟方法求概率,和用电脑控制的飞行模拟器练习飞行做个比较。两种模拟方法都有很多人用,也都有共同的弱点:模拟的效果取决于你建立的模型,若模型不恰当,模拟结果就不会好。飞行模拟器使用的是飞机会如何反应的软件模型,统计模拟使用的是概率模型。我们会用表A中的随机数字,来启动模拟程序。
1702637910
1702637911
模拟
1702637912
1702637913
利用随机数字表或者计算机软件来模仿随机现象,就叫作模拟(simulation)。
1702637914
1702637915
我们讨论模拟,部分原因在于它是科学家和工程师用来计算复杂问题概率的方法。模拟被用于制定减少人们在银行柜台和机场值机柜台前,以及在选举投票点等候时间的策略。模拟可以用于研究温室效应,可以用于研究灾难性事件的影响,例如核电站事故、核装置爆炸的后果,或在一个人口密集城市中一种致命传染病的散播情况。
1702637916
1702637917
我们讨论模拟的另一个原因是,模拟会迫使我们仔细思考概率模型的意义。我们要学习的是困难的部分,也就是建立模型;而容易的部分,例如让电脑重复计算10000次,就留给真正需要算出概率的人吧。
1702637918
1702637919
知识普及 真正的随机数字
1702637920
1702637921
对于要求“纯正”随机数字的人,兰德公司很久以前就出版了《一百万个随机数字》一书。书中列出了1000000个数字,它们由十分复杂的物理随机系统生成,是真正的随机数字。有一位兰德公司的工作人员曾经告诉我,这并不是兰德公司出版的书中最无聊的一本……
1702637922
1702637923
模拟入门
1702637924
1702637925
一旦有了可靠的概率模型,模拟就是找出复杂事件发生概率的有效工具,我们可以利用随机数字,模拟出多次实验的结果。一个事件在这些结果中所占的比例,迟早会接近它的发生概率,所以模拟可以对概率做适当的估计。要学习模拟的技术,最好的方法就是多看几个例子。
1702637926
1702637927
例1 如何模拟
1702637928
1702637929
抛10次硬币,连续出现至少三次正面朝上或三次反面朝上的概率有多大?
1702637930
1702637931
第一步:建立概率模型。我们抛硬币的概率模型包含两个部分:
1702637932
1702637933
• 每一次出现正面朝上或反面朝上的概率都是0.5。
1702637934
1702637935
• 每次抛掷都是独立的。也就是说,知道某一次的抛掷结果,不会影响其他的抛掷结果。
1702637936
1702637937
第二步:为结果分配数字。表A中的数字,可在满足第一步要求的前提下代表各种结果。我们知道,表A中的数字会是0~9中任何一个,概率都是0.1,而且数字之间是相互独立的。以下是分配数字的一个方法:
1702637938
1702637939
• 一个数字模拟一次抛硬币。
1702637940
1702637941
• 奇数代表正面朝上,偶数代表反面朝上。
[
上一页 ]
[ :1.702637892e+09 ]
[
下一页 ]