打字猴:1.70155154e+09
1701551540 第五,我们没有立刻看到“物体”,即那些我们来计数、分类,并冠以名词标签的可移动物质块。就视觉而言,它甚至不清楚物体是什么。当戴维·马尔考虑如何设计一个能够发现物体的计算机视觉系统时,他不得不问:
1701551541
1701551542 鼻子是一个物体吗?脑袋算吗?如果它接到身体上还算吗?一个骑在马背上的人呢?这些问题说明,划分影像区域是一个多么困难的问题,其困难程度几乎与哲学问题不相上下。其实这些问题没有答案——所有这些东西可以是一个物体,如果你愿意那样想它们的话,或者它们也可以是一个更大物体的一部分。
1701551543
1701551544 一滴强力胶可以将两个物体变成一个,但视觉系统没办法知道这一点。
1701551545
1701551546 然而,我们对它们之间的表面和边界却有着非常明显的感觉。心理学中最著名的错觉来自大脑永无止境地竭力将视域雕刻为平面,并决定哪一个在另一个的前面。一个例子是鲁宾的人脸-花瓶(Rubin face-vase,见图4-21),图像在一个高脚杯和一对两人面对面的轮廓之间闪变。人脸与花瓶不能被同时看到(即使有人想象两人用他们的鼻子举起高脚杯也不行),无论哪个形状主导“拥有”了区分界线,都将另一片限制作为模糊的背景。
1701551547
1701551548
1701551549
1701551550
1701551551 图4-21
1701551552
1701551553 另一个例子是卡尼莎三角形(Kanisza triangle,见图4-22),本来什么都没有,却组成了一个像真的,仿佛用墨水铭刻在其中的形状。
1701551554
1701551555
1701551556
1701551557
1701551558 图4-22
1701551559
1701551560 人脸、花瓶和三角形都是熟悉的物体,但错觉并不依赖于它们的熟悉性;毫无意义的斑块同样具有震撼力(见图4-23)。
1701551561
1701551562
1701551563
1701551564
1701551565 图4-23
1701551566
1701551567 我们并不是主动地感知到平面,而是被我们视网膜中涌现出的信息所驱使的;与流行的观点恰恰相反,我们并不是看到我们所希望看到的。
1701551568
1701551569 那么视觉的产品是什么呢?马尔称之为二维半草图;其他人叫它能看到的平面表征。深度被降级为半维,因为它没有界定所带视觉信息的介质(不像左右和高低维度),而只是那个介质中所携带的一条信息。想想用几百个滑栓组成的玩具,你将这些滑扣按到一个三维表面上(比如说一张脸),在另一面就形成了一个栓扣轮廓组成的平面模板。这个轮廓有三维,但这三维不是相等的。从边至边和从上至下的位置是由特定的栓扣界定的;深度位置则是由栓扣突出多少决定的。对于任何一个深度都有许多栓扣;而对于任何栓扣则只有一个深度。
1701551570
1701551571 这个二维半草图看上去有些像图4-24。
1701551572
1701551573
1701551574
1701551575
1701551576 图4-24
1701551577
1701551578 它是一个单元或像素的拼制图,每个单元或像素表示从中央独视眼观察点的一道视线。它的宽度比高度更长,因为我们的两只眼睛是并排安置在我们的头盖骨上,而不是一只在另一只的上方。视域中心的单位要比外围的更小,因为我们的解析度在中心更高。每个单元可以代表一个平面或一道边的信息,就好像它有两种空白表格需要填写。一块平面的表格中,有关于深度、倾斜度(平面向后或向前倾斜多少)、偏度(向左或向右偏斜多少)以及颜色的空格,还有一个标签表示它被看作属于哪块平面。一道边的表格中则有备选的方框,表示它是否是一个物体、沟槽或一道隆脊的边界,还有一个表示其方向的刻度盘,也显示(如果是物体边界的话)哪一边属于“拥有”边界的表面和哪一边只充当背景。当然,我们大脑中并不会真正发现这种表格。这个图形是一个描述二维半度草图中信息种类的混合物。大脑估计会利用神经元簇和它们的活动来保留信息,这些信息会作为记录时得到的地图集合,被分配到不同的皮层片区。
1701551579
1701551580 为什么我们会看到两个半维度?为什么不是大脑中的一个模型?储存的成本和收益给出了部分答案。任何计算机使用者都知道,图形文件会占用大量储存空间。大脑没有将进来的千兆字节集聚成一个混合模型,这样的话一旦任何东西一移动,这个模型就会失效;大脑让世界自己来储存一眼无法分类的信息。我们的脑袋伸直了,我们的眼睛快速转动,一个全新的、最新式的草图就加载下来了。至于第三维度的次级地位,这几乎是无法避免的。不像其他两种维度,它们能在当时激活的视杆和视锥细胞中显示出来,深度则必须从数据中痛苦地提炼。尝试计算深度的立体图、轮廓、阴影和位移专家们具有能力,来传递有关相对于观看者的距离、倾斜度、偏度和咬合度的信息,而不是世界的三维坐标。它们至多能做的是聚集它们的努力,给我们提供一个与二维半似曾相识的东西,其表面就呈现在我们眼前。这就要靠大脑其余的部分来弄明白如何使用它了。
1701551581
1701551582 心智探奇:人类心智的起源与进化 [:1701549391]
1701551583 参考框架
1701551584
1701551585 这个二维半草图是视觉系统巧妙设计、协调运转设备的杰作。它只有一个问题:这个作品在交货时是没有用的。
1701551586
1701551587 二维半草图中的信息是被列注在一个视网膜的参考框架中的,这是一个以观看者为中心的坐标系统。如果一个特定单元说,“这儿有一个边缘”,“这儿”的意思是视网膜上那个单元的位置——比方说,当你正对着这条线观看的时候,这个位置指的就是你的正前方。如果你是一棵树,在看另一棵树,那没问题,但只要有东西一动——你的眼睛、你的头、你的身体、一个看到的物体——原有的信息便会悄悄地移动到阵列上的另一个位置栖息。排列中信息引导的任何大脑的部分会发现,现在信息失效了。如果你的手被引导着伸向视域中心,因为那个地方有一个苹果,现在这只手伸向的地方只是一片空地。如果昨天你在看你车门把手时会记起你的车的图像,今天你所看到的车挡板将不符合这个图像;这两幅图景几乎不会重叠。你甚至无法做出简单的判断,比如两条线是否是平行的。还记得交汇在一起的铁轨吧。
1701551588
1701551589 这些问题令人渴望在脑海中有一个刻度模型,但那不是视觉所提供的。使用视觉信息的关键不在于重塑它,而在于适当地获取它,这就要求有一个有用的参考框架或坐标系统。参考框架与位置的观念是纠缠在一起的。你如何回答“它在哪里”这个问题呢?通过命名一个提问者已经知道的物体——参考框架——并描述“它”相对于这个框架距离有多远,在什么方向。一个如“冰箱旁边”的语言描述、一个街道地址、指南针方向、经度纬度、全球定位系统卫星坐标——这些都表示相对于一个参考框架的距离和方向。爱因斯坦构建他的相对论是凭借质疑牛顿假定的参考框架,这个参考框架在某种程度上像空中楼阁一样,与其中任何东西都不相关联。
[ 上一页 ]  [ :1.70155154e+09 ]  [ 下一页 ]