1700506411
人们在观察原子周围的电子时发现,电子也是一种人类无法用有效的方法描述其运动状态的微粒物质。所以,人们使用“电子云”模型的概念来描述它。以氢原子为例,简单地说,就是在任一时刻对原子进行一次“拍照”,把它的位置用一个点记录下来,然后在另一时刻同样进行一次“拍照”并做记录。持续进行这样的操作,当收集到足够多的“照片”后进行图像的叠加,就会发现大量的点集中在距离原子核比较近的位置,而在距离原子核相对较远的位置点比较少。这种由点的稀疏和稠密而产生的类似云状的概率描述模型叫作“电子云”(如图8-11所示)。不仅是氢原子,其他原子同样会产生类似的电子云效果。这种电子云本身给原子半径的测量带来了麻烦吗?这个麻烦究竟有多大?是应该计算电子云最外侧的圆形的半径,还是应该按照这些点的半径做加权平均?这些点的位置本身不就是在不停地变化吗?由这些不断变化的小粒子组成的物质岂不是在一刻不停地受到来自底层变化的影响?我们还有可能准确测得这些物质的尺寸吗?还是有科学的办法。我们要感谢棣莫弗和拉普拉斯,以及由他们发现的棣莫弗-拉普拉斯中心极限定理(如图8-12所示)。
1700506412
1700506413
1700506414
1700506415
图8-11 氢原子的电子云模型示意图 图8-12 中心极限定理 设随机变量Xn(n=1, 2,……)服从参数为p的二项分布,则对任意的x恒有
1700506416
1700506417
1700506418
1700506419
1700506420
1700506421
这种形态看上去已经有点像正态分布了。在一个二项分布中,只要样本足够多,有一个概率的概率密度遵循N(0, 1)——μ为0,σ为1的正态分布——这个概率就是的概率。也就是说,只要n足够大,这个遵循二项分布(伯努利分布)的nX的每一项与它的数学期望的差值,都是在0附近分布的情况多,向两侧延伸出去的情况少,服从正态分布。
1700506422
1700506423
1700506424
其实不光是伯努利分布,其他任何分布的Xn都满足这一条件——当样本足够多的时候,任何随机变量Xn与它的数学期望的差值都服从正态分布。当然,不同的Xn与它的数学期望的差值所产生的正态分布的σ是不同的,而μ都为0。不仅如此,如果Xn和Yn独立且满足,那么令Zn=aXn+bYn,且a、b都为实数,Zn仍旧服从正态分布。
1700506425
1700506426
这种结论得出后,刚才我们谈到的物体长度测量问题就有理论依据了。即使每个原子的大小都是一个随机值,而在大量原子直径叠加的过程中,本应依靠测量大量原子的平均长度再加和,但由于这个测量的误差值是一个正态分布,所以就可以等价于测量大量原子加和后的总长度,这个总长度仍然会有一个误差值,而且这个误差值也仍然是一个正态分布,且永远无法消灭。除了原子自身大小的变化,其他任何本身误差都属于正态分布,而且可以由线性叠加施加给被测对象的值因素都会最终在被测量的值上以正态分布的误差表现出来,例如引力、磁场等。这些从组成世界的微小因子上体现出来的正态分布特性逐渐、逐层叠加,最终形成了现在体现在不同领域的各种各样的呈现正态分布的观测结果。
1700506427
1700506428
还有一个有趣的特性。假设Xn和Yn是独立随机变量,Zn=aXn+ bYn,如果Zn是正态分布的,那么Xn和Yn也是正态分布的,这也称为“Cramer分解定理”。这种方式为我们将大的研究对象分解为小的研究对象并对其采用同一种观测和分析方法提供了理论依据。这种正态分布可以叠加也可以分解的过程是一种非常“优美”的过程,它让我们可以使用同态的观测方式对形形色色的物质进行观测,并以此为依据进行误差减小的估算。
1700506429
1700506430
在我的理解中,正态分布是一种从宏观上体现出来的个体值与真实值差距的表示。正态分布线性叠加的结果还是正态分布,组成正态分布的线性叠加的因子本身也是正态分布,这种自相似式的分布特点,让众多数学家无比着迷。这是一种“超然存在”的状态,不管我们是否能意识到它,它一直这样存在着。我们能感知它的存在,但是无法改变它——这就是数学最大的魅力吧!难怪很多人会说,数学是离神祗最近的一种语言。这种说法或许并不夸张,因为无论如何,正态分布都可以说是所有分布中最为基础且适用范围最广的。
1700506431
1700506433
8.8.3 其他分布
1700506434
1700506435
除了正态分布以外,在统计学中还有很多分布特性可以用于解决一部分具有某些特殊性的统计问题,例如伯努利分布、泊松分布、伽马分布、卡方分布、T分布、F分布等。这些分布的适用场景都比较固定,也就形成了在相应场景中固定的使用方法和公式,成为定势性质的工具。
1700506436
1700506437
1.伯努利分布
1700506438
1700506439
伯努利分布是专门研究一个随机过程中事件X发生的概率p与事件X不发生的概率1-p的随机过程中的概率定量计算问题,表示为
1700506440
1700506441
1700506442
1700506443
1700506444
满足伯努利分布的随机变量满足一个性质:可以通过这样一个公式来计算在n次试验中发生k次n=1事件的概率。
1700506445
1700506446
1700506447
1700506448
1700506449
2.泊松分布
1700506450
1700506451
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。泊松分布适合描述单位时间内随机事件发生的次数。在一个时间段内一个事件发生的次数为λ次,则发生k次的概率用下面这个公式来计算。
1700506452
1700506453
1700506454
1700506455
1700506456
3.卡方分布
1700506457
1700506458
卡方分布(χ2分布)研究的是n个服从标准正态分布的随机变量x1, x2,…, xn的平方和
1700506459
1700506460
[
上一页 ]
[ :1.700506411e+09 ]
[
下一页 ]