打字猴:1.701551532e+09
1701551532 第一,视觉不是环幕电影院。我们能形象体验到的只是我们眼前的景物;视域周围以外的世界和脑袋后面的世界只是以一种模糊的印象、几乎是用思想推理的方式为我们所知的。我知道我身后有一个书架,面前有一个窗户,但我只看到了窗户,却没看到书架。更糟糕的是,眼睛一秒钟从一点扫过另一点好几次,中央凹瞄准器之外所看到的事物其实非常粗糙。将手举到视线前几厘米处,你根本无法数指头。我不只是在温习眼球构造的解剖学。人们可以想象,大脑根据每一瞥得到的快照来拼一个拼贴画,就像一个全景相机曝光一帧胶卷一样,摄下精确的一部分景物,曝光到邻接的一段胶卷,再继续下去,最后得到一幅无缝的宽角度照片。但大脑不是一台全景相机。实验室研究表明,当人们移动眼睛或头部时,他们立刻就失去了他们刚看到的图像细节。
1701551533
1701551534 第二,我们没有X光的视觉。我们看表面而不是看体积。如果你看到我将一个物体放进一个盒子里或放到一棵树后面,你知道它在哪儿,但却看不到它,也说不出它的细节。同样,这也不只是为了提醒你说你不是超人。我们凡人本可以装备上一个照相机般的记忆,将之前看到的有关信息与现在看到的粘贴在一起来更新三维模型。但我们没有这样的装备。看不到有关具体的视觉细节就不在大脑里了。
1701551535
1701551536 第三,我们看物体时有视角。当你站在两根铁轨之间时,它们似乎交汇于地平线。当然你知道它们没有真的交汇,如果交汇的话,火车就会脱轨。但你不可能看不到它们交汇,尽管你的深度感觉提供了足够的信息使你的大脑能够抵消这个效果。我们还知道,移动的东西会放大和收缩。在一个真正的比例模型中,这些都不会发生。为了准确,视觉系统将视角减少到一定程度。除艺术家之外,其他人很难将桌子的近角投映为锐角,远角投映为钝角;现实中它们看起来都是直角。但铁轨显示视角并没有完全消除。
1701551537
1701551538 第四,在严格的几何意义上,我们看到的是二维,而不是三维。数学家亨利·庞加莱(Henri Poincaré)得出一种确定某个物体维数的简单方法。找一个东西能够将该物体分为两部分,然后数数这个分隔东西的维数再加一。一个点不能被分割,所以它是零维的。一条线有一维,因为它能被一个点分割。一个面有二维,因为它可以被一条线分开,尽管它不能被点分开。一个球有三维,因为任何少于二维的刀片都无法劈开它;一个小球或一根针不能分开它。那么视域呢?它可以被一条线分开。例如,地平线将视域一分为二。当我们站在一条绷紧的电缆前面时,我们所看到每件东西要么在这一边,要么在另一边。圆桌的周长线也分隔了视域:每个点要么在里面,要么在外面。给一条线加一维度你就得到了二维。根据这条标准,视域是二维的。顺便说一句,这并不意味着视域是扁平的。二维平面可以在第三维被弯曲,就像一个橡胶模具或是一个吸塑包装一样。
1701551539
1701551540 第五,我们没有立刻看到“物体”,即那些我们来计数、分类,并冠以名词标签的可移动物质块。就视觉而言,它甚至不清楚物体是什么。当戴维·马尔考虑如何设计一个能够发现物体的计算机视觉系统时,他不得不问:
1701551541
1701551542 鼻子是一个物体吗?脑袋算吗?如果它接到身体上还算吗?一个骑在马背上的人呢?这些问题说明,划分影像区域是一个多么困难的问题,其困难程度几乎与哲学问题不相上下。其实这些问题没有答案——所有这些东西可以是一个物体,如果你愿意那样想它们的话,或者它们也可以是一个更大物体的一部分。
1701551543
1701551544 一滴强力胶可以将两个物体变成一个,但视觉系统没办法知道这一点。
1701551545
1701551546 然而,我们对它们之间的表面和边界却有着非常明显的感觉。心理学中最著名的错觉来自大脑永无止境地竭力将视域雕刻为平面,并决定哪一个在另一个的前面。一个例子是鲁宾的人脸-花瓶(Rubin face-vase,见图4-21),图像在一个高脚杯和一对两人面对面的轮廓之间闪变。人脸与花瓶不能被同时看到(即使有人想象两人用他们的鼻子举起高脚杯也不行),无论哪个形状主导“拥有”了区分界线,都将另一片限制作为模糊的背景。
1701551547
1701551548
1701551549
1701551550
1701551551 图4-21
1701551552
1701551553 另一个例子是卡尼莎三角形(Kanisza triangle,见图4-22),本来什么都没有,却组成了一个像真的,仿佛用墨水铭刻在其中的形状。
1701551554
1701551555
1701551556
1701551557
1701551558 图4-22
1701551559
1701551560 人脸、花瓶和三角形都是熟悉的物体,但错觉并不依赖于它们的熟悉性;毫无意义的斑块同样具有震撼力(见图4-23)。
1701551561
1701551562
1701551563
1701551564
1701551565 图4-23
1701551566
1701551567 我们并不是主动地感知到平面,而是被我们视网膜中涌现出的信息所驱使的;与流行的观点恰恰相反,我们并不是看到我们所希望看到的。
1701551568
1701551569 那么视觉的产品是什么呢?马尔称之为二维半草图;其他人叫它能看到的平面表征。深度被降级为半维,因为它没有界定所带视觉信息的介质(不像左右和高低维度),而只是那个介质中所携带的一条信息。想想用几百个滑栓组成的玩具,你将这些滑扣按到一个三维表面上(比如说一张脸),在另一面就形成了一个栓扣轮廓组成的平面模板。这个轮廓有三维,但这三维不是相等的。从边至边和从上至下的位置是由特定的栓扣界定的;深度位置则是由栓扣突出多少决定的。对于任何一个深度都有许多栓扣;而对于任何栓扣则只有一个深度。
1701551570
1701551571 这个二维半草图看上去有些像图4-24。
1701551572
1701551573
1701551574
1701551575
1701551576 图4-24
1701551577
1701551578 它是一个单元或像素的拼制图,每个单元或像素表示从中央独视眼观察点的一道视线。它的宽度比高度更长,因为我们的两只眼睛是并排安置在我们的头盖骨上,而不是一只在另一只的上方。视域中心的单位要比外围的更小,因为我们的解析度在中心更高。每个单元可以代表一个平面或一道边的信息,就好像它有两种空白表格需要填写。一块平面的表格中,有关于深度、倾斜度(平面向后或向前倾斜多少)、偏度(向左或向右偏斜多少)以及颜色的空格,还有一个标签表示它被看作属于哪块平面。一道边的表格中则有备选的方框,表示它是否是一个物体、沟槽或一道隆脊的边界,还有一个表示其方向的刻度盘,也显示(如果是物体边界的话)哪一边属于“拥有”边界的表面和哪一边只充当背景。当然,我们大脑中并不会真正发现这种表格。这个图形是一个描述二维半度草图中信息种类的混合物。大脑估计会利用神经元簇和它们的活动来保留信息,这些信息会作为记录时得到的地图集合,被分配到不同的皮层片区。
1701551579
1701551580 为什么我们会看到两个半维度?为什么不是大脑中的一个模型?储存的成本和收益给出了部分答案。任何计算机使用者都知道,图形文件会占用大量储存空间。大脑没有将进来的千兆字节集聚成一个混合模型,这样的话一旦任何东西一移动,这个模型就会失效;大脑让世界自己来储存一眼无法分类的信息。我们的脑袋伸直了,我们的眼睛快速转动,一个全新的、最新式的草图就加载下来了。至于第三维度的次级地位,这几乎是无法避免的。不像其他两种维度,它们能在当时激活的视杆和视锥细胞中显示出来,深度则必须从数据中痛苦地提炼。尝试计算深度的立体图、轮廓、阴影和位移专家们具有能力,来传递有关相对于观看者的距离、倾斜度、偏度和咬合度的信息,而不是世界的三维坐标。它们至多能做的是聚集它们的努力,给我们提供一个与二维半似曾相识的东西,其表面就呈现在我们眼前。这就要靠大脑其余的部分来弄明白如何使用它了。
1701551581
[ 上一页 ]  [ :1.701551532e+09 ]  [ 下一页 ]