打字猴:1.70155154e+09

1701551540 第五，我们没有立刻看到“物体”，即那些我们来计数、分类，并冠以名词标签的可移动物质块。就视觉而言，它甚至不清楚物体是什么。当戴维·马尔考虑如何设计一个能够发现物体的计算机视觉系统时，他不得不问：

1701551541

1701551542 鼻子是一个物体吗？脑袋算吗？如果它接到身体上还算吗？一个骑在马背上的人呢？这些问题说明，划分影像区域是一个多么困难的问题，其困难程度几乎与哲学问题不相上下。其实这些问题没有答案——所有这些东西可以是一个物体，如果你愿意那样想它们的话，或者它们也可以是一个更大物体的一部分。

1701551543

1701551544 一滴强力胶可以将两个物体变成一个，但视觉系统没办法知道这一点。

1701551545

1701551546 然而，我们对它们之间的表面和边界却有着非常明显的感觉。心理学中最著名的错觉来自大脑永无止境地竭力将视域雕刻为平面，并决定哪一个在另一个的前面。一个例子是鲁宾的人脸-花瓶（Rubin face-vase，见图4-21），图像在一个高脚杯和一对两人面对面的轮廓之间闪变。人脸与花瓶不能被同时看到（即使有人想象两人用他们的鼻子举起高脚杯也不行），无论哪个形状主导“拥有”了区分界线，都将另一片限制作为模糊的背景。

1701551547

1701551548

1701551549

1701551550

1701551551 图4-21

1701551552

1701551553 另一个例子是卡尼莎三角形（Kanisza triangle，见图4-22），本来什么都没有，却组成了一个像真的，仿佛用墨水铭刻在其中的形状。

1701551554

1701551555

1701551556

1701551557

1701551558 图4-22

1701551559

1701551560 人脸、花瓶和三角形都是熟悉的物体，但错觉并不依赖于它们的熟悉性；毫无意义的斑块同样具有震撼力（见图4-23）。

1701551561

1701551562

1701551563

1701551564

1701551565 图4-23

1701551566

1701551567 我们并不是主动地感知到平面，而是被我们视网膜中涌现出的信息所驱使的；与流行的观点恰恰相反，我们并不是看到我们所希望看到的。

1701551568

1701551569 那么视觉的产品是什么呢？马尔称之为二维半草图；其他人叫它能看到的平面表征。深度被降级为半维，因为它没有界定所带视觉信息的介质（不像左右和高低维度），而只是那个介质中所携带的一条信息。想想用几百个滑栓组成的玩具，你将这些滑扣按到一个三维表面上（比如说一张脸），在另一面就形成了一个栓扣轮廓组成的平面模板。这个轮廓有三维，但这三维不是相等的。从边至边和从上至下的位置是由特定的栓扣界定的；深度位置则是由栓扣突出多少决定的。对于任何一个深度都有许多栓扣；而对于任何栓扣则只有一个深度。

1701551570

1701551571 这个二维半草图看上去有些像图4-24。

1701551572

1701551573

1701551574

1701551575

1701551576 图4-24

1701551577

1701551578 它是一个单元或像素的拼制图，每个单元或像素表示从中央独视眼观察点的一道视线。它的宽度比高度更长，因为我们的两只眼睛是并排安置在我们的头盖骨上，而不是一只在另一只的上方。视域中心的单位要比外围的更小，因为我们的解析度在中心更高。每个单元可以代表一个平面或一道边的信息，就好像它有两种空白表格需要填写。一块平面的表格中，有关于深度、倾斜度（平面向后或向前倾斜多少）、偏度（向左或向右偏斜多少）以及颜色的空格，还有一个标签表示它被看作属于哪块平面。一道边的表格中则有备选的方框，表示它是否是一个物体、沟槽或一道隆脊的边界，还有一个表示其方向的刻度盘，也显示（如果是物体边界的话）哪一边属于“拥有”边界的表面和哪一边只充当背景。当然，我们大脑中并不会真正发现这种表格。这个图形是一个描述二维半度草图中信息种类的混合物。大脑估计会利用神经元簇和它们的活动来保留信息，这些信息会作为记录时得到的地图集合，被分配到不同的皮层片区。

1701551579

1701551580 为什么我们会看到两个半维度？为什么不是大脑中的一个模型？储存的成本和收益给出了部分答案。任何计算机使用者都知道，图形文件会占用大量储存空间。大脑没有将进来的千兆字节集聚成一个混合模型，这样的话一旦任何东西一移动，这个模型就会失效；大脑让世界自己来储存一眼无法分类的信息。我们的脑袋伸直了，我们的眼睛快速转动，一个全新的、最新式的草图就加载下来了。至于第三维度的次级地位，这几乎是无法避免的。不像其他两种维度，它们能在当时激活的视杆和视锥细胞中显示出来，深度则必须从数据中痛苦地提炼。尝试计算深度的立体图、轮廓、阴影和位移专家们具有能力，来传递有关相对于观看者的距离、倾斜度、偏度和咬合度的信息，而不是世界的三维坐标。它们至多能做的是聚集它们的努力，给我们提供一个与二维半似曾相识的东西，其表面就呈现在我们眼前。这就要靠大脑其余的部分来弄明白如何使用它了。

1701551581

1701551582 心智探奇：人类心智的起源与进化 [:1701549391]

1701551583 参考框架

1701551584

1701551585 这个二维半草图是视觉系统巧妙设计、协调运转设备的杰作。它只有一个问题：这个作品在交货时是没有用的。

1701551586

1701551587 二维半草图中的信息是被列注在一个视网膜的参考框架中的，这是一个以观看者为中心的坐标系统。如果一个特定单元说，“这儿有一个边缘”，“这儿”的意思是视网膜上那个单元的位置——比方说，当你正对着这条线观看的时候，这个位置指的就是你的正前方。如果你是一棵树，在看另一棵树，那没问题，但只要有东西一动——你的眼睛、你的头、你的身体、一个看到的物体——原有的信息便会悄悄地移动到阵列上的另一个位置栖息。排列中信息引导的任何大脑的部分会发现，现在信息失效了。如果你的手被引导着伸向视域中心，因为那个地方有一个苹果，现在这只手伸向的地方只是一片空地。如果昨天你在看你车门把手时会记起你的车的图像，今天你所看到的车挡板将不符合这个图像；这两幅图景几乎不会重叠。你甚至无法做出简单的判断，比如两条线是否是平行的。还记得交汇在一起的铁轨吧。

1701551588

1701551589 这些问题令人渴望在脑海中有一个刻度模型，但那不是视觉所提供的。使用视觉信息的关键不在于重塑它，而在于适当地获取它，这就要求有一个有用的参考框架或坐标系统。参考框架与位置的观念是纠缠在一起的。你如何回答“它在哪里”这个问题呢？通过命名一个提问者已经知道的物体——参考框架——并描述“它”相对于这个框架距离有多远，在什么方向。一个如“冰箱旁边”的语言描述、一个街道地址、指南针方向、经度纬度、全球定位系统卫星坐标——这些都表示相对于一个参考框架的距离和方向。爱因斯坦构建他的相对论是凭借质疑牛顿假定的参考框架，这个参考框架在某种程度上像空中楼阁一样，与其中任何东西都不相关联。

[ 上一页 ] [ :1.70155154e+09 ] [ 下一页 ]