1701551172
立体视觉
1701551173
1701551174
我们从立体图开始谈起吧。它们是怎么回事,为什么它们对有些人就不起作用呢?尽管有那么多张贴画、书和拼图游戏,我还没见过谁试图将其中的原理向数百万名好奇的消费者解释。理解立体图不仅是掌握知觉工作原理的良好方式,而且还是满足心智好奇的一种方法。立体图还是自然选择杰出设计的又一个例子,只不过这一次是发生在我们自己的大脑里。
1701551175
1701551176
立体图利用了不止一个关于如何戏弄眼睛的发现,而是利用了四个。首先,说起来奇怪,是图片本身戏弄了我们。摄影图片、绘画、电视还有电影把我们折腾得不胜厌烦,以至于都忘了它们本是一种有益的错觉。墨迹或闪烁的磷光点能让我们笑、让我们哭甚至唤起我们的性欲。人类制作图片的历史至少已有3万年,与某些社会科学的民间传说恰恰相反,将图片看作一种描述的能力是人类共通的。心理学家保罗·埃克曼(Paul Ekman)引发了一场人类学的狂热,他证明了与世隔绝的新几内亚高地人能够辨认出照片中加州大学学生的面部表情。情绪像其他任何事情一样,被认为是与文化相关的。而一个更基本的发现则被淹没在喧嚣中:新几内亚高地人是在看照片上的内容而不是把它们当作斑驳的灰纸。
1701551177
1701551178
图片利用了反射,这是一个令知觉成为难题的光学法则。当从平面反射的一个光子(光能的单位)沿着一条线收缩透过瞳孔,刺激眼球内曲面上的光感受器(杆状体和锥状体)时,视觉就产生了。感受器将神经符号上传到大脑,大脑的首要任务就是弄清楚光子来自何处。然而,界定光子路径的光线一直延伸到无穷,大脑所知的全部仅仅是那个光源就在光射线上的某一处。大脑所能判断的,它或许是在一厘米远,一公里远,或者是许多光年那么远;关于第三维的信息,也就是光源到眼睛的距离,已经在投射的过程中遗失了。这种对物体距离上的不确定性,还会在上百个光感受器之间以排列组合的方式暴增——其中每一个感受器都无法刺激它的光源距离做出精准的预测。因此,任何视网膜图像都可能是由世界上无限多种三维平面的组合排列而产生的。
1701551179
1701551180
当然,我们并没有感知到无限的可能性;我们只确定一个,且通常是接近于正确的那个。这就是幻象产生的开端。如果布置一些物体,使其投映在视网膜上的图像与大脑的偏好中所识别物体的图像相同,而大脑就没有办法分辨出它们的差异。一个简单的例子是维多利亚时代的一项发明——通过房门窥视孔看到的是一个装饰豪华的房间,然而当门打开时,却发现房间里空空如也,原来那个豪华房间是钉在房门窥视孔上的一个玩具屋。
1701551181
1701551182
开始是画家,后来成为心理学家的埃德尔伯特·阿米斯(Adelbert Ames, Jr.),在其职业生涯的开创时建造了一个更为奇特的幻觉之屋。在一个这样的屋子中,满屋杂乱无章的线上悬挂着一些杆和板。但如果从外面通过墙上一个窥视孔看这个房间,这些杆和板连接起来投映为一把厨房椅子的映像。在另一个房间中,后墙从左到右逐渐倾斜,但它的角度非常古怪,使得左边低得可以抵消它在视角上的扩展,而右边高得足以抵消它在视角上的收缩。通过对面的窥视孔,这面墙投映出的是一个长方形。视觉系统不喜欢巧合:它推测一幅规则的图像来源于一些真的、规则的东西,而不是由一个不规则形状的偶然调整而产生的效果。阿米斯确实校准了一个不规则的形状才得出一幅规则的图像,他还用歪曲的窗户和地板砖来强化他狡猾的把戏产生的效果。当一个小孩站在近角而她妈妈站在远角时,这个孩子在视网膜上投映出更大的图像(见图4-1)。大脑在评估大小时也将深度考虑在内;这就是为什么日常生活中近处学步的孩子看上去并不会比远处的父母更大的原因。而现在,观察者的深度感成了它不喜欢巧合的牺牲品。墙上的每一寸地方都似乎有着相同的距离,因此解释视网膜上的物体图像就根据表面的情况,故而小孩看上去就比妈妈高得多。当她们沿着那堵后墙交换位置后,小孩就缩成了哈巴狗的大小,而妈妈则变成了威尔特·张伯伦(Wilt Chamberlain)[11]的高度。阿米斯的房间已经建在了几家科学博物馆中,如旧金山的探索馆,你可以亲眼看到(或者亲自体验让别人感受)这个令人惊叹的错觉。
1701551183
1701551184
1701551185
1701551186
1701551187
图4-1
1701551188
1701551189
一张图片不过是布置东西的一种更方便的方式,这样它可以投映出与实际物体相同的效果。模仿的东西是位于一个平面上的,不是在一个玩具屋中,或是由线悬挂着的,它是靠涂抹颜料而形成的,而不是将木头切出形状。即使没有阿米斯式幻象,涂抹的形状也能够确定。达·芬奇曾简洁地描述过这个把戏:“视角不过就是在一面很透明的玻璃后面看一处地方,在玻璃面上画下后面的物体。”如果绘画者是从一个固定的观察位置来看风景,并忠实地复制出它的轮廓,一直到狗的最后一根毛发,那么从绘画者位置观看这幅画的人眼中映入的就是原始景色投映的相同的一束光线。在那部分视觉域中的图画与世界是没有区别的。无论什么假设迫使大脑将世界看成世界而不是看作涂抹的颜料,它们也同样会迫使大脑将图画看成世界,而不是看作涂抹的颜料。
1701551190
1701551191
这些假设是什么呢?我们稍后会继续探讨,不过在这里先做一个概览。平面的色彩和质地都是均匀分布的(即覆盖着规则的颗粒、波浪或斑点形状等),因此平面上点纹的逐渐变化是由光与视角造成的。世界上常有一些平行的、对称的、规则的直角形状位于平地之上,但它们看上去似乎是渐进递减式的连续;这种渐进递减的连续形成的就是视角的一种作用。物体有着规则、紧凑的轮廓,所以如果物体A的一小块被拿掉而被物体B填满那个空缺,那么A就在B的后面;而不会是看起来B的凸出的部分涌入了A缺失的一块。在图4-2中,你能体会到这些假设的作用,它们传达了一种深度的感觉。
1701551192
1701551193
1701551194
1701551195
1701551196
图4-2 深度的感觉
1701551197
1701551198
在实践中,现实主义画家们没有在窗户上涂抹作画,而是使用记忆中的视觉图像和神奇的大脑在画布上完成作品。他们会使用的工具,包括了由细线或是刻印在玻璃板上的细痕而制成的方格坐标、穿越过画布上针孔并紧紧绑在场景和一个观察用标线装置之间的细线,照相机暗箱,投影仪,还有现代的尼康相机。当然,没有画家能够把狗的每根毛都一丝不落地画下来。绘画技巧、画布质地,以及框架形状都使得一幅画达不到达·芬奇窗户的理想状态。此外,我们几乎总是从一个与绘画者在其窗前估测的观察点不同的位置来看一幅画,这就使得映入眼中的那束光不同于真实风景所散发出的光束。这就是为什么绘画只是部分的幻觉:我们看到了绘画所描述的内容,但我们同时只把它看作一幅画,而不是现实。画布和边框向我们泄漏了差异,值得注意的是,我们用这些线索来确定我们相对于这幅图的观察点,并弥补与绘画者观察点之间的差异。我们因此能去除观看画作时所看到的失真现象,而能从画家的角度,去正确诠释那些经过调整后的形状。弥补工作仅限于此。我们去影院看电影迟到时坐到了前排,这时我们观察点和摄影机观察点(类比于透过达·芬奇窗户的画家)之间的差异被拉伸得过大,我们会看到歪歪扭扭的演员在不规则的四边形上滑来滑去。
1701551199
1701551200
艺术与生活之间还有一点不同之处。画家只能从一个观察点来看景色,而观看者从两个观察点来看世界:他左眼的观察点和右眼的观察点。伸出一只手指,保持静止,并闭上一只眼睛,然后闭上另一只。手指遮蔽了它背后世界的不同部分。两只眼睛有着略微不同的视觉,这种几何现象被称为双目视差。
1701551201
1701551202
许多动物都有两只眼睛,这样每当它们向前瞄准时,它们的视野会有所重叠(而不是为了向外看到全景),自然选择一定曾面临过将双眼的图画组合成一幅统一图像,使得大脑的其他部分都可以使用这幅图的问题。这个假想图像的名字是根据脑门中间长着唯一一只眼睛的神话人物而得来的:独眼巨人——奥德修斯在旅行中遇到的单眼巨人种族的一员。制作独眼图像的问题是,没有直接的方式可以将两只眼的视域叠加起来。大多数物体落在两个影像的不同位置,其不同视它们距离多远而定:物体离得越近,它的模拟图在两眼中的各自映像就离得更远。设想桌上有一个苹果,苹果后面有个柠檬,苹果前面有串樱桃(见图4-3)。
1701551203
1701551204
1701551205
1701551206
1701551207
图4-3
1701551208
1701551209
你的眼睛盯着苹果,所以苹果的图像落在了每只眼睛的凹处(视网膜的平滑中心,那里的视觉是最敏锐的)。苹果在两只眼睛的六点钟方向。现在来看这串樱桃的映像,它们与苹果离得更近。在左眼,樱桃在七点钟方向,在右眼,它们在五点钟方向,而不是七点钟方向。与苹果离得更远的柠檬在左眼映像是在五点半方向,在右眼的映像是在六点半方向。比固定点离得更近的物体逐渐向着太阳穴外移;离得更远的物体则向着鼻子内移。
1701551210
1701551211
但这个简单叠加的不可能性为演化提供了一个机遇。只要学过一些高中的三角学,人们就可以用物体在两只眼睛上映像的差异,以及通过双目注视和双目在头盖骨中分处形成的角度,来计算物体距离有多远。如果自然选择能够连接一个神经计算机来计算三角问题,一种双眼的生物就可以粉碎达·芬奇的窗户而感受到物体的深度。这种机制就被称为立体视觉。
1701551212
1701551213
令人难以置信的是,几千年来竟没有人注意到这一点。科学家们认为,动物有两只眼睛的原因和有两个肾的原因一样:身体两边对称方案的副产品,这样也许当一个器官损坏了,另一个就可以备用。欧几里得、阿基米德和牛顿都没有注意到立体视觉的可能性,甚至连达·芬奇也没有完全理解它。达·芬奇没注意到,两只眼睛会看到一个球体的不同部分,左眼对它左边看得稍远些,而右眼对它右边看得稍远些。要是他用一个立方体而不是球来作例子,他就会注意到,视网膜上的投影是不同的。立体视觉直到1838年才被物理学家查尔斯·惠斯顿(Charles Wheatstone)发现。惠斯顿还是一位发明家,惠斯顿电桥就是以他的名字命名的。惠斯顿写道:
1701551214
1701551215
为什么艺术家不可能对任何近乎固态的物体进行忠实的描绘,答案是显而易见的了。所谓忠实描绘是指,心智对于图画和原物体本身无法区分。当用两只眼睛来看画和物体时,对于画,视网膜上投映的是两张类似的图像;而对于固态物体,两幅图像则是不相似的。在这两种情况下,感觉器官上留下的印迹,以及由此在大脑中形成的知觉都是有根本差别的。因此,画不可能与固态物体相混淆。
1701551216
1701551217
这么晚才发现立体视觉有些令人奇怪,因为它在日常生活经验中并不难发现。你走路的时候,将一只眼睛闭上几分钟,世界就变成了更平的地方,你可能会被门廊蹭着,或将一勺糖舀到膝盖上。当然,世界并没有完全变平,脑中仍然有着图片和电视里呈现的那种信息,比如递减、咬合、是否置于地面和质地成分。最重要的是,还有位移运动。当你移动时,你的观察点在连续改变,使得近处的物体呼啸而过,而远处的物体动得较慢。大脑将这种流态模式理解为经过一个三维世界。光学流态对结构的知觉在《星际迷航》《星球大战》中都有明显的体现,还有在一些流行的计算机屏幕保护中:逐渐离开显示屏中心的白点显示的是飞向太空(尽管真正的星星离得太过遥远,没办法令真实世界的星际舰队成员产生这样的印象)。所有这些对深度的单目线索使得单眼盲人生活不大受影响,其中包括飞行员威利·普斯特(Wiley Post)和20世纪70年代纽约巨人橄榄球队的一位外接手。大脑是一个机会主义者,还是一个数学很好的信息消费者,或许这就是为什么双目视差能长久以来一直避开科学家们审视的原因。
1701551218
1701551219
惠斯顿设计了第一幅完全三维的图画——立体图,这样他就证明了,心智将三角学纳入了意识。惠斯顿的想法很简单,他用达·芬奇的两扇窗户,或者实际点儿,用两台照相机来捕捉一幅图景,每台相机的位置就和一只眼睛要看的位置一样(如图4-4)。将右边的照片放在右眼前,左边的照片放在左眼前。如果大脑推测两眼在看一个三维世界,与双目视差看到的有所不同,它就会被照片所愚弄,将两张照片组合成一幅单眼图景,其中物体看上去有着不同的深度。
1701551220
[
上一页 ]
[ :1.701551171e+09 ]
[
下一页 ]