打字猴:1.701026394e+09
1701026394 那么,在几何学中,相关性指的是什么呢?为方便理解,我们回过头,再次研究2011年1月和2012年1月10个加州城市1月份平均气温的表格。我们发现,2011年的气温与2012年的气温之间存在非常强的正相关性,根据皮尔逊的公式,该相关系数是0.989。
1701026395
1701026396 在研究两个不同年份气温测量数据之间的关系时,我们可以把表中各数据项减去相同的量,这个操作不会影响结果。如果2011年的气温与2012年的气温之间存在相关性,那么它与“2012年的气温+5华氏度”之间也必然存在相关性。我们还可以换一种方法来考虑这个问题:如果我们把图中所有的点都向上移动5英寸,那么高尔顿的椭圆形不会改变,发生改变的只是它的位置。事实证明,如果把这些气温值加上或减去一个相同的量,将更有利于我们的分析研究。比如,在这个案例中,两列数值分别减去2011年与2012年的气温平均值,我们就会得到下表:
1701026397
1701026398
1701026399
1701026400
1701026401 在这张表中,数据为负值时表示该城市气温较低,如特拉基;数据为正值时表示气温较高,如圣迭戈。
1701026402
1701026403 接下来的步骤非常关键。记录2011年1月气温情况的那一列有10个数字,因此这一列就是一串数字,它还是一个点。这是怎么回事呢?这得归功于笛卡儿。我们可以把两个数字的组合(x, y)看成平面上的一个点,x自原点向右,y自原点向上,并画出一个从原点指向点(x, y)的短箭头,这个箭头叫作“向量”(vector)。
1701026404
1701026405
1701026406
1701026407
1701026408 同样,三维空间中的点可以表示成三个数字的组合(x, y, z)。只要我们不因循守旧,敢于创新,就能有所突破。4个数字的组合可以看成是四维空间中的点,那么,表中表示加州各地气温情况的那10个数字,就是十维空间中的点。不过,更好的做法是把它看成一个十维向量。
1701026409
1701026410 此时,大家有足够的理由提出疑问:我应该怎么考虑这个十维向量?它到底是什么样子?
1701026411
1701026412 十维向量的样子如下图所示:
1701026413
1701026414
1701026415
1701026416
1701026417 这是高级几何学中隐藏的一个小秘密。拥有处理十维(甚至一百维、一百万维)几何体的能力似乎是一件非常美妙的事,但是,我们的脑海里只能产生二维最多三维几何体的形象,这是我们思维能力的极限。值得庆幸的是,这种有限的思维能力足以帮助我们处理一些问题。
1701026418
1701026419 高维几何体似乎有些神秘,因为我们生活在一个三维世界里(加上时间维度就是四维,如果我们是弦论学家,就可能是二十六维。即便如此,我们也会认为宇宙在其中大多数维度上的延伸是有限的)。我们为什么要研究高维几何体呢?
1701026420
1701026421 时下特别流行的数据研究给出了一个答案。大家还记得前面讨论的用400万像素照相机拍摄的那幅照片吧,那幅照片被描述成了400万个数字,每个数字对应一个像素。(这是在不考虑颜色的情况下得到的结果。)因此,该影像就是一个四百万维向量,或者说,是四百万维空间中的一个点。随时间变化的影像就可以表示成一个在四百万维空间中移动的点,在四百万维空间中留下一条线。也就是说,不知不觉中,我们已经在研究四百万维向量的微积分问题了,而且,我们还会发现这样的研究其乐无穷。
1701026422
1701026423 接下来我们继续讨论气温问题。表中有两列数据,每列都是一个十维向量,如下图所示:
1701026424
1701026425
1701026426
1701026427
1701026428 这两个向量的方向大致相同,表明这两列数据实际上区别不大。我们已经知道,2011年最冷的城市在2012年也非常冷,气温高的城市情况亦大致如此。
1701026429
1701026430 这就是用几何语言表述的皮尔逊公式,两个变量之间的相关性是由这两个向量之间的夹角决定的。如果用三角学来描述,相关性就是夹角的余弦。至于你是否记得余弦的含义,这并不重要,你只需知道0度角(即两个向量指向相同方向)的余弦为1,180度角(两个向量指向相反方向)的余弦为–1。如果两个向量的夹角为锐角(小于90度的角),那么它们之间存在正相关关系;如果两个向量的夹角大于90度,即为钝角,那么它们之间存在负相关关系。笼统地讲,当夹角为锐角时,两个向量“指向相同方向”;而当夹角为钝角时,两个向量会“指向相反方向”。
1701026431
1701026432 如果夹角既不是锐角也不是钝角,而是直角,那么这两个变量之间不存在相关性。在几何学中,我们把夹角为直角的两个向量叫作“垂直”(perpendicular)或“正交”(orthogonal)向量。数学家以及那些对三角学情有独钟的人经常延伸“orthogonal”这个词的内涵,用它来表示某个东西与手头上的东西没有任何关系。例如,“你可能以为你深受欢迎的原因与你的数学技能有关,但是,根据我的经验,这两者之间没有任何‘交集’(orthogonal)”。慢慢地,为三角学痴迷者们所青睐的这种用法就变成了人们广泛使用的语言。我从美国高等法院近期发生的口头辩论中摘选了一段,帮助你们了解这个现象。
1701026433
1701026434 弗雷德先生:我认为那个问题与我们在这里讨论的问题没有任何“交集”,因为我们州承认……
1701026435
1701026436 首席法官罗伯茨:对不起。没有任何什么?
1701026437
1701026438 弗雷德先生:交集。两者毫无关联,没有任何相关性。
1701026439
1701026440 首席法官罗伯茨:哦。
1701026441
1701026442 法官萨卡里亚:是哪个词啊?我喜欢这个词。
1701026443
[ 上一页 ]  [ :1.701026394e+09 ]  [ 下一页 ]