1701026260
1701026261
1701026262
1701026263
1701026264
注:在计算中值时,各数据项均选取该数据项的中间值。表头所给的数字为62.2、63.2等数值,而没有选用62.5、63.5等,原因是观察结果不均匀地分布在62与63、63与64之间,但是人们却明显偏好选用整数来表示人的身高。经过慎重考虑,我认为本表所选用的表头最符合研究的前提条件。在关于中亲身高的观察数据中,没有发现明显的不均匀性。
1701026265
1701026266
1701026267
1701026268
1701026269
高尔顿发现自己绘制的散点图表现出惊人的规律性:所有等值线都是椭圆形,一个包含另一个,且中心都在同一个点上。这幅图就像一座山峰的标准等高线图,最高点是父亲与儿子平均身高所对应的点,而这两个身高在高尔顿的散点图中出现的次数最多。其实,这座山峰就相当于棣莫弗曾经研究过的“法国警察的帽子”,只不过是三维的,用专业术语表达就是“二元正态分布”(bivariate normal distribution)。
1701026270
1701026271
1701026272
1701026273
1701026274
如果像本章第二幅散点图那样,儿子的身高与父母的身高没有任何相关性,这些椭圆形就会变成圆形,散点图的形状看上去也大致呈圆形。如果像本章第一幅散点图那样,儿子的身高不受任何随机性的影响,而完全由遗传基因决定,这些点就会沿着一条对角线排列,我们可以把它看成是一个被压扁了的椭圆形。在这两种极端情况之间,有胖瘦程度各异的椭圆形。胖瘦程度在经典几何学中被称作椭圆形的“离心率”(eccentricity),可以测量父亲身高对儿子身高的影响程度。离心率高则意味着遗传因素的作用大,而回归平均值的作用小;离心率低则意味着相反情况,此时回归平均值起到决定性作用。高尔顿则把这个量叫作“相关系数”(correlation),这个概念一直被沿用至今。当高尔顿的椭圆形接近于圆形时,相关系数接近零;当椭圆形很扁并且它的轴沿着东北—西南方向延伸,相关系数就接近于1。高尔顿发现,借助离心率(这是一个非常古老的几何量,它的历史至少与公元前3世纪阿波罗尼奥斯的研究成果一样久远)可以测量两个变量之间的相关性,这样,19世纪生物学的一个前沿问题——遗传因素作用的量化问题就迎刃而解了。
1701026275
1701026276
如果我们是适度的怀疑论者,就会想到一个问题:假如我们的散点图看上去并不像一个椭圆形,会怎么样呢?实用主义者的答案是:在实践中,我们根据现实数据集绘制的散点图通常大致呈椭圆形。虽然不是一贯如此,但是经常如此,因此这项技术可以得到广泛的应用。下面这幅图表现的是2004年约翰·克里(John Kerry)的得票率与2008年巴拉克·奥巴马的得票率的对比。图中每个点分别代表休斯敦的一个地区。
1701026277
1701026278
在这幅图中,椭圆形清晰可见,而且非常扁,这说明克里的得票率与奥巴马的得票率高度相关。此外,大多数点位于对角线上方,这说明奥巴马的总体得票情况优于克里。
1701026279
1701026280
1701026281
1701026282
1701026283
下面这幅图表现的是谷歌公司与通用电气公司在几年时间内的日股票价格波动情况。
1701026284
1701026285
1701026286
1701026287
1701026288
下面这幅图我们在前文中见过,它表现的是SAT平均分与北卡罗来纳州若干大学的学费之间的关系。
1701026289
1701026290
1701026291
1701026292
1701026293
这些数据来源各不相同,但是,三个案例的散点图的形状跟表现父亲与儿子身高的散点图相似,都近似椭圆形。在第一和第三个例子中,相关系数为正值,表示一个变量的增加与另一个变量的增加存在相关关系,椭圆形由东北指向西南方向。在第二个例子中,相关系数为负值,说明比较富裕的州倾向于支持民主党,椭圆形由西北指向东南方向。
1701026294
1701026295
数学的复杂与简单
1701026296
1701026297
对于阿波罗尼奥斯与希腊几何学家而言,椭圆形就是圆锥体的斜截面。开普勒指出,天体的运行轨迹不是人们以为的圆形,而是椭圆形。(不过,天文学界用了几十年的时间才接受了他的这个观点。)现在,这种曲线再次粉墨登场,化身为一种自然图形,将表示父亲与儿子身高的那些点包含其中,这是为什么呢?是不是因为有某个圆锥体躲在角落里,偷偷地掌控着遗传基因,如果以适当的角度切割这个圆锥体,就会得到高尔顿的椭圆形?当然不是。那么,遗传基因是否受到某种类似于万有引力的影响,促使高尔顿的散点图变成椭圆形了呢?答案也是否定的。
1701026298
1701026299
正确的答案要从数学的某个基本属性中寻找。从某种意义上讲,科学家之所以认为数学非常重要,就是因为这种属性。数学有非常多复杂的研究对象,但是简单的研究对象却寥寥无几。因此,如果某个问题的解需要用简单的数学语言来描述,那么我们可以选用的描述方法是非常有限的。这种情况导致最简单的数学实体随处可见,因为它们要身兼数职,解答各种问题。
1701026300
1701026301
最简单的线是直线。我们都知道,直线随处可见,从水晶的棱边到不受任何外力作用的物体的运动轨迹。简单性仅次于直线的是二次曲线。在二次方程式中,相乘的变量不得超过两个,因此,一个变量的平方、两个不同变量的乘积都是允许的,但是三次方或者用一个变量的平方与另一个变量相乘,则是被严格禁止的。按照以前的习惯,包括椭圆形在内的这种曲线仍然叫作圆锥体斜截面,但是勇于创新的代数几何学家把它们叫作“二次曲面”(quadric)。二次方程式的数量非常多,但是它们都满足下面这个形式:
1701026302
1701026303
Ax2+Bxy+Cy2+Dx+Ey+F=0
1701026304
1701026305
其中A、B、C、D、E和F为常量。(有兴趣的读者可以自行验证,在只允许两个变量相乘而绝不可以有三个变量相乘的条件下,我们只能采用这种代数表达式。)从这个表达式看,二次方程式可以有很多个,事实上,二次方程式有无穷多个!但是,二次曲面只有三个主要的类型:椭圆形、双曲线和抛物线,如下图所示。
1701026306
1701026307
1701026308
1701026309
[
上一页 ]
[ :1.70102626e+09 ]
[
下一页 ]