打字猴:1.701026283e+09
1701026283 下面这幅图表现的是谷歌公司与通用电气公司在几年时间内的日股票价格波动情况。
1701026284
1701026285
1701026286
1701026287
1701026288 下面这幅图我们在前文中见过,它表现的是SAT平均分与北卡罗来纳州若干大学的学费之间的关系。
1701026289
1701026290
1701026291
1701026292
1701026293 这些数据来源各不相同,但是,三个案例的散点图的形状跟表现父亲与儿子身高的散点图相似,都近似椭圆形。在第一和第三个例子中,相关系数为正值,表示一个变量的增加与另一个变量的增加存在相关关系,椭圆形由东北指向西南方向。在第二个例子中,相关系数为负值,说明比较富裕的州倾向于支持民主党,椭圆形由西北指向东南方向。
1701026294
1701026295 数学的复杂与简单
1701026296
1701026297 对于阿波罗尼奥斯与希腊几何学家而言,椭圆形就是圆锥体的斜截面。开普勒指出,天体的运行轨迹不是人们以为的圆形,而是椭圆形。(不过,天文学界用了几十年的时间才接受了他的这个观点。)现在,这种曲线再次粉墨登场,化身为一种自然图形,将表示父亲与儿子身高的那些点包含其中,这是为什么呢?是不是因为有某个圆锥体躲在角落里,偷偷地掌控着遗传基因,如果以适当的角度切割这个圆锥体,就会得到高尔顿的椭圆形?当然不是。那么,遗传基因是否受到某种类似于万有引力的影响,促使高尔顿的散点图变成椭圆形了呢?答案也是否定的。
1701026298
1701026299 正确的答案要从数学的某个基本属性中寻找。从某种意义上讲,科学家之所以认为数学非常重要,就是因为这种属性。数学有非常多复杂的研究对象,但是简单的研究对象却寥寥无几。因此,如果某个问题的解需要用简单的数学语言来描述,那么我们可以选用的描述方法是非常有限的。这种情况导致最简单的数学实体随处可见,因为它们要身兼数职,解答各种问题。
1701026300
1701026301 最简单的线是直线。我们都知道,直线随处可见,从水晶的棱边到不受任何外力作用的物体的运动轨迹。简单性仅次于直线的是二次曲线。在二次方程式中,相乘的变量不得超过两个,因此,一个变量的平方、两个不同变量的乘积都是允许的,但是三次方或者用一个变量的平方与另一个变量相乘,则是被严格禁止的。按照以前的习惯,包括椭圆形在内的这种曲线仍然叫作圆锥体斜截面,但是勇于创新的代数几何学家把它们叫作“二次曲面”(quadric)。二次方程式的数量非常多,但是它们都满足下面这个形式:
1701026302
1701026303 Ax2+Bxy+Cy2+Dx+Ey+F=0
1701026304
1701026305 其中A、B、C、D、E和F为常量。(有兴趣的读者可以自行验证,在只允许两个变量相乘而绝不可以有三个变量相乘的条件下,我们只能采用这种代数表达式。)从这个表达式看,二次方程式可以有很多个,事实上,二次方程式有无穷多个!但是,二次曲面只有三个主要的类型:椭圆形、双曲线和抛物线,如下图所示。
1701026306
1701026307
1701026308
1701026309
1701026310 我们发现,有很多科学问题的解都表现为这三种曲线。不仅天体的运动轨迹如此,曲面镜的优化设计、抛射体的弧形轨道以及彩虹的形状也是如此。
1701026311
1701026312 这三种曲线的应用甚至超出了科学领域。我的同事迈克尔·哈里斯(Michael Harris)是巴黎朱西厄数学研究院的一名杰出的数论学家。哈里斯认为,小说家托马斯·品钦(Thomas Pynchon)有三部作品可以用圆锥体斜截面来表示:《万有引力之虹》(Gravity’s Rainbow)是抛物线(那些刚刚发射和正在坠落的火箭),《梅森和迪克逊》(Mason & Dixon)是椭圆形,《抵抗白昼》(Against the Day)是双曲线。对我而言,用这种方法分析这三部小说的组织结构,效果不比我见过的其他任何方法差。品钦曾经学习物理专业,经常在小说中提到莫比乌斯带、四元数这样的专业词汇,他当然清楚圆锥体斜截面的含义。
1701026313
1701026314 高尔顿观察到自己手绘的这些曲线非常像椭圆形,但是他的几何知识并不丰富,因此无法确定这些曲线就是椭圆形,而不是其他类似的卵形图。由于他一心希望建立一套简洁的普适理论,那么在理解收集来的数据时他会不会因此受到影响呢?果真如此的话,他既不会是科学界犯此类错误的第一个人,也不会是最后一个人。高尔顿一贯谨慎,他找到剑桥大学的数学家汉密尔顿·迪克森(Hamilton Dickson),咨询他的意见。为了不让迪克森偏向于某个结论,他特意隐瞒了数据的来源,诡称在从事物理学研究时遇到了一个问题。迪克森很快确认这个椭圆形不仅是数据所表示的曲线,而且是理论所需要的曲线,这让高尔顿十分高兴。
1701026315
1701026316 高尔顿在他的著作中写道:“这个问题对于一位功底深厚的数学家而言可能并不是特别难,但是,迪克森单凭数学推理就证实了我辛辛苦苦得出的各种统计学结论,而且其细致入微的程度甚至超出了我最乐观大胆的预测。这些数据在某种程度上讲有点儿粗糙,我在处理时必须加倍小心。因此,在得到迪克森的答复之后,数学分析一锤定音的权威性和不容置疑的掌控力,让我深深折服、无限崇拜。”
1701026317
1701026318 谁偷走了世界名画《蒙娜丽莎》?
1701026319
1701026320 高尔顿很快发现,相关系数的应用并不仅限于遗传研究领域,只要两个量彼此之间可能有关系,就可以用相关系数来分析。
1701026321
1701026322 碰巧的是,高尔顿拥有一个人身测量方面的大型数据库。由于阿方斯·贝蒂荣(Alphonse Bertillon)的研究成果,“人身测定法”在19世纪末风靡一时。贝蒂荣是法国的一名犯罪学家,对待科学研究的态度与高尔顿非常相似,他热衷于运用严格的量化方法来研究人类,而且他深信这是一种行之有效的方法。当时,法国警察辨别嫌犯的做法非常随意,没有一套系统的方法,这让贝蒂荣深感不安。他想,如果在每个违法的法国人的资料中附上一系列测量数据,诸如头的长度与宽度、手指与脚掌的长度等,这种办法肯定会大大提高警察辨识嫌犯的效率。根据贝蒂荣的这套方法,每名嫌犯被捕之后,警察都会测量他的数据,并将数据记录存档备用。如果这个人再次被捕,辨识他的身份就变得非常简单:只需要得到他的测量数据,然后与档案中的数据记录进行比对即可。可以用代号取代真实的姓名,“啊哈,15–6–56–42先生,你以为你可以逍遥法外吗?”
1701026323
1701026324 由于贝蒂荣的这套系统性的方法与当时的分析学宗旨十分吻合,因此于1883年被巴黎市警察总局采用,并迅速推广到世界各地。包括布加勒斯特和布宜诺斯艾利斯在内的各大城市的警察局,都采用了贝蒂荣的人身测定法,并把它作为辨识嫌犯的权威方法。1915年,雷蒙德·福斯迪克(Rcoymond Fosdick)指出:“贝蒂荣的人身测量数据文件柜是现代警察机构特有的标志。”这种做法在美国也曾十分盛行,而且没有人对此提出任何异议。2013年,大法官安东尼·肯尼迪(Anthony Kennedy)在为马里兰州诉肯恩一案撰写关键性意见时提到了这个方法,允许各州采集因犯重罪而入狱的犯人的DNA样本。肯尼迪法官认为,DNA序列是21世纪的贝蒂荣人身测定法,是可以被添加到人身测量数据库中的一组数据。
1701026325
1701026326 高尔顿思考了一个问题:贝蒂荣所选择的那些测量数据是不是最合适呢?如果测量更多的数据,有没有可能更准确地辨识嫌犯呢?高尔顿发现,这些人体测量数据有一个问题,它们并不是完全独立的。如果我们测量了嫌犯双手的数据,是不是仍然需要测量他双脚的数据呢?人们普遍相信,如果一个人的手比较大,从统计学的角度看,他的双脚也很有可能大于平均值。因此,在测量了双手的数据之后再测量双脚的尺寸,贝蒂荣人身测定法可以利用的信息并不会如人们最初希望的那样大幅增加。随着测量的数据越来越多(尤其当测量项目的选择不是很科学时),有可能产生边际效用递减的现象。
1701026327
1701026328 为了研究这个问题,高尔顿绘制了另一幅散点图,分析身高与肘长(肘部到中指指尖的距离)之间的关系。结果,同父子身高的关系散点图一样,这幅图也呈现出相似的椭圆形。就这样,高尔顿借助图表再一次证明身高与肘长这两个变量间存在相关关系,尽管两者之间没有显著的相关性。如果两种测量数据高度相关(如左脚和右脚的长度),那么费时费力地把这两个数据都记录下来的做法意义不大。最有效的测量数据应该与其余各项数据都没有相关性,而有相关性的数据可以通过高尔顿收集的大量人体测量数据计算出来。
1701026329
1701026330 高尔顿发明的相关系数概念并没有让贝蒂荣的人身测定法得到大幅改进,其原因主要在于高尔顿本人,他支持的是人身测定法的竞争对手——指纹鉴定法。同贝蒂荣的人身测定法一样,指纹鉴定法也是利用一系列数字或符号来辨识嫌犯,而且这些数据或符号可以记录到卡片上,然后分类归档。指纹鉴定法的优势非常明显,其中最突出的优点是,在罪犯本人不在场的情况下也可以采集他的指纹,这个优点在1911年的温森·佩鲁贾(Vincenzo Peruggia)案中凸显出来。当时,佩鲁贾采取了一个大胆的行动,在光天化日之下从卢浮宫偷走了名画《蒙娜丽莎》。佩鲁贾曾在巴黎被捕过,当时,警察非常尽职地记录了他的相关数据,但是,人们却发现这张人身测定数据记录卡并不能指认佩鲁贾。如果卡片上记录有指纹鉴定信息,那么仅凭佩鲁贾留在被他丢弃的《蒙娜丽莎》画框上的指纹,就可以立刻指证他。
1701026331
1701026332 相关性、《欢乐颂》与数字压缩技术
[ 上一页 ]  [ :1.701026283e+09 ]  [ 下一页 ]