1702637956
1702637957
当然,25组数字并不足以让我们对这个概率信心满满。既然我们知道如何做模拟,我们就可以用计算机重复进行几千次。多次模拟(或复杂的数学计算)可以算出真实概率大约是0.826。大多数人认为连续三次或多次出现正面朝上或反面朝上是不正常的,但就连我们这个次数不多的模拟也挑战了我们的直觉。连续抛硬币10次,很多时候都会出现连续三次正面朝上或反面朝上的结果。
1702637958
1702637959
一旦你对模拟有了一些经验以后,就会发现整个过程中最困难的部分,通常是建立概率模型(第一步)。虽然抛硬币这个例子可能不大吸引你,例1中的模型却能解决许多概率问题,因为它是由许多独立的实验(抛硬币)构成的,每次实验都有同样的可能结果与概率。投篮10次和观察10个孩子的性别,其概率模型与例1类似,也可以用几乎一样的方法进行模拟。这个模型的假设前提是:各次实验都是彼此独立的。这个假设可以简化我们的模拟工作,因为可以用完全一样的方法模拟抛10次硬币的结果与概率。
1702637960
1702637961
独立性
1702637962
1702637963
如果两个随机现象其中之一的结果,并不会改变另一个结果的发生概率,就称这两个随机现象是独立的(independent)。
1702637964
1702637965
独立性和概率的其他性质一样,一定要重复观察很多次才能证实。多次抛硬币,其结果应该是彼此独立的(硬币没有记忆),经过观察发现事实确实如此。但要说一个篮球运动员的先后投篮之间彼此独立,就不那么可信了,不过观察显示,它们至少十分接近彼此独立。
1702637966
1702637967
第二步(分配随机数字)根据的是随机数字表的性质。以下是这个步骤的一些例子。
1702637968
1702637969
例2 为模拟分配数字
1702637970
1702637971
(a)从就业率为70%的一个群体中选出一个人,一个个位数代表一个人:
1702637972
1702637973
0,1,2,3,4,5,6=就业者
1702637974
1702637975
7,8,9=失业者
1702637976
1702637977
(b)从就业率为73%的一个群体中选出一个人,一个两位数代表一个人:
1702637978
1702637979
00,01,02,…72=就业者
1702637980
1702637981
73,74,75,…99=失业者
1702637982
1702637983
我们分配100个两位数中的73个代表“就业者”,概率为0.73。如果用01,02,…73代表“就业者”,用74,75,…99,00代表“失业者”,也是正确的。
1702637984
1702637985
(c)从就业率为50%的一个群体中选出一个人,该群体中20%的人是失业者,30%的人是非就业人口。一个个位数代表一个人:
1702637986
1702637987
0,1,2,3,4=就业者
1702637988
1702637989
5,6=失业者
1702637990
1702637991
7,8,9=非就业人口
1702637992
1702637993
练习
1702637994
1702637995
19.1 随机抽一张扑克牌。在一副标准的52张扑克牌中,有13张黑桃、13张红心、13张方块和13张梅花。你如何在模拟时分配代表从52张牌中随机抽取的某张牌花色(黑桃、红心、方块和梅花)的数字?
1702637996
1702637997
1702637998
1702637999
1702638000
“我知道了!模拟树木,模拟羽毛,模拟咖啡,而现在是模拟概率!”
1702638001
1702638002
关于独立性的思考
1702638003
1702638004
在讨论更精细的统计模拟之前,有必要更深入地讨论独立性的概念。我们之前说过,独立性只能通过观察多次重复的随机现象加以验证。也许更准确的说法是,缺乏独立性只能通过随机现象的多次重复加以验证。人们如何识别两个并非彼此独立的随机现象呢?例如,我们如何判断多次抛一枚公平的硬币(也就是出现正面朝上和反面朝上的概率各占一半)的结果是不是彼此独立的呢?
1702638005
[
上一页 ]
[ :1.702637956e+09 ]
[
下一页 ]