1701551321
1701551322
图4-12 飘浮的长方形
1701551323
1701551324
你还应当能看到图4-12下端有一个切开的窗口。我切窗口是通过选出一个长方形小块,并做了与我以前做的相反的事情:我在这小块里的每一个点4旁边塞进去额外一点(标志为“X”)。这将散点簇推开得更远,它们变成每隔11个空格才重复一次。你会注意到,被添加的行比其余的要长。间隔空间更宽的各相同点簇相当于更远的一个平面。当然,一个真正的随机散点自动立体视图是用点而不是用数字做的,所以你不会注意到被剪出或塞进的东西,参差不齐的线被填满了额外的点。这里有个例子(图4-13)。看一个真正的随机散点自动立体视图的乐趣在于,令观看者惊讶的那一刻呈现出的是观看者先前看不到的形状。
1701551325
1701551326
1701551327
1701551328
1701551329
图4-13
1701551330
1701551331
当自动立体视图风靡日本时,它很快发展为一种艺术形式。点并不是必要的;任何挂毯类的装饰,只要包含着很多的小轮廓,足以迷惑大脑将目光锁定到邻近条格,就会产生立体视图效果。第一个商业化自动立体视图使用了彩色的弯曲线,日本的自动立体视图使用了花朵、海洋波浪,还有从阿米斯的书中取下的一片叶子,组成的无数片树叶。多亏了计算机,立体图像里浮现的形状也不再只局限于死板的镂空形状而已。通过读取平面上三维坐标的点,计算机能够以略微不同的数量来更迭每一个点,从而在中央独视空间中塑造固定形状,而不是严格地变换整个小块。浮现出来的是光滑、球茎的形状,看上去好像它们是用叶子或花朵形成的。
1701551332
1701551333
为什么自然选择为我们配设的装备是真正的中央独眼视觉(能够双眼共同看到形状,但任何一只单眼却不行),而不是一个更简单的双眼立体机制呢?(这样任何一只眼看到的柠檬和樱桃都会一致)泰勒指出,我们的祖先确实生活在阿米斯的树叶屋里。灵长目在树上演化,需要识别认清树叶掩盖下的树枝网络。认不清的代价就是从高高的树枝上跌落到森林的地面上。为这些双眼生物构建一个双眼立体计算机系统一定是自然选择所无法抗拒的,但它之所以能够实现,也是基于对数千个视觉组织进行过计算。能够清晰匹配一致的单个物体太少了,彼此之间也隔得太远。
1701551334
1701551335
朱利斯指出了中央独眼视觉的另一个优点。动物们使用伪装要比军队早得多。最早的灵长目动物就类似于今天的猿猴亚目、马达加斯加的狐猿和眼镜猴,它们抓树上的昆虫吃。许多昆虫躲避捕猎者的方式是纹丝不动(这样捕猎者的移动探测器就派不上用场了),或者通过伪装(这样捕猎者的外形轮廓探测器也就失灵了)。中央独眼视觉是一种有效的反抵抗措施,就像空中侦察发现坦克和飞机一样发现了猎物。武器的技术发展催生了军备竞赛,这在自然界中和在战争中一样。一些昆虫瞒住捕猎者立体视觉的方式是通过将身体扁平化,并与地面齐平,或者变成活的树叶和树枝雕塑——一种三维的伪装。
1701551336
1701551337
中央独视眼是如何工作的呢?匹配问题,即将一只眼中的标志与另一只眼中的对应物彼此匹配的问题,是一个复杂的鸡与蛋的困惑。只有你选择了一对要测量的标志,你才能衡量一对标志的立体差异。但在一个树叶屋或随机散点立体视图中,有数千个能够作为标志的候选物体。如果你知道表面有多远,你就会知道向左眼视网膜的什么地方看,从而找到右眼中对应的标志。但如果你知道这个,就没必要进行立体计算了——你已经有了答案。心智是怎么做到的呢?
1701551338
1701551339
戴维·马尔表示,对我们所演化世界的预置前提假设能够有所帮助。在n个点的n2个可能匹配中,并不是所有的匹配都有可能出现在我们所处的美妙环境——地球上。一个设计良好的匹配者应该只考虑那些在物理上可能的匹配点。
1701551340
1701551341
第一,世界上的每个标志都是被锚定在某个时间某个平面的某个位置上的。因此,一个合理的匹配必须将两眼中相同的点进行配对,而这两点来自真实世界的一个点。一只眼中的一个黑点应与另一只眼中的一个黑点匹配,而不是与一个白点匹配,因为所谓匹配要表示某个平面的单独一个位置,而那个位置不可能同时既是一个黑点又是一个白点。反过来说,如果一个黑点与一个黑点匹配,它们一定来自真实世界某个平面的一个位置。这就是自动立体视图所违背的假设:在立体视图中,每一个定点的影像都是被分散到了几个不同的位置。
1701551342
1701551343
第二,一只眼中的一个点应当与另一只眼中不超过一个点相匹配。这就是说,一只眼的视线应当会与真实世界中一个且仅仅一个平面的一点终结。乍一看,这个假设好像是排除了穿过一个透明平面到一个不透明平面的视线(像一个浅湖的底部)。但这个假设实际上更为微妙;它只排除了一种巧合情况,即两个相同点(一个点在湖面,一个点在湖底)从左眼观察点角度看一个排在另一个后面,而从右眼的角度看两点则都能看见。
1701551344
1701551345
第三,物质是内聚而且光滑的。大多数时候,一条视线所终结的真实世界平面不会比临近视线所接触的平面离得更近或更远。也就是说,真实世界的临近点一般会位于同一个光滑平面。当然,这个假设在物体的边缘位置就被违背了:本书封底的边缘就在离你四五厘米近的地方,但如果你只向它的右边瞥一眼,你也许就是在看38万公里之外的月亮。但边缘只组成了视域的很小一部分(你画一幅线性画所需的颜料比为这幅画填色所需的颜料要少得多),因此这些例外能够被忽略。这个假设排除的是一个由沙尘暴、大群蚊虫、团团细线、陡峭山峰间的深深裂隙及星星点点的钉床组成的世界。
1701551346
1701551347
这些假设在理论上听起来似乎都是言之成理,但还需要找到一些满足这些假设的匹配。鸡和蛋的问题有时可以用被称为“限制性满意”的技术来解决,我们在第2章谈论内克尔立方体和带口音的讲话时曾提到过这种技术。当一个谜的几部分不能一次都解决时,解谜者可以一次猜几个,再比较这个谜不同部分的猜测,来看看哪些是相互一致的。一个很好的类比就是用铅笔和橡皮来做填字游戏。一个水平单词的线索往往太模糊,好几个单词都可以填进去;一个垂直单词的线索也很模糊,好几个单词也可以填进去。但如果这些猜测的垂直单词中,只有一个与任何猜测的水平单词共用一个字母,这对单词就被保留下来,其他的就被擦掉了。设想对所有的线索和方格即刻做此处理,你这样的做法就是限制性满意。在解决立体视觉的匹配问题时,散点就是线索,匹配和深度是猜测,关于世界的3个假设就像是这条规则:每个单词的每个字母都必须占据一个方格,每个方格里必须有一个字母,所有的字母必须能组合成单词。
1701551348
1701551349
限制性满意有时可以在一个像我在图2-8中提供的限制性网络中实行。马尔和理论神经学家托马索·伯吉奥(Tomaso Poggio)设计了一个立体视觉限制性网络。输入单位代表点,就像随机散点立体视图的黑白方块。他们用右眼的一些其他点输入到代表左眼中一点的所有n×n可能匹配的单位排列。当其中一个单位开启时,这个网络在猜测,在世界的特定深度有一块斑点(相对于目光汇聚的地方)。图4-14是这个网络一个平面的鸟瞰图,显示了一部分这些单位。
1701551350
1701551351
1701551352
1701551353
1701551354
图4-14
1701551355
1701551356
这个模型是这样工作的:当阵列中的某一个单元由两眼获得了相同的输入信号时,它会呈现开启的状态(黑的或白的),这包含了第一个假设(每个标志锚定于一个平面)。由于各单位是相互作用的,激活一个单位会促使其上下临近单位的激活。排列在相同视线的不同匹配单位彼此相互约束,这包含了第二个假设(没有沿着一条视线而校准一致的标志)。在附近深度的临近点单位彼此相互激活,这包含了第三个假设(物质是具有内聚性的)。这些被激活的单位围绕着网络回荡着,网络最终稳定下来,那些激活的单位描绘出一个具有深度的轮廓。在图4-14中,那些填入的单位呈现出悬在背景之上的一道边缘。
1701551357
1701551358
在限制性满意技术中,数千个处理器做了许多临时的猜测,在众多猜测中甄选出一个整体答案,这种技术是与认为大脑的工作是许多个相互作用的处理器平行计算的一般性观点相一致的。它也抓住了一些心理学的要旨。在看一个复杂的随机散点立体视图时,你往往不能看到隐藏的图像同时显现出来。杂乱无章的图案中会跳出一些边缘,然后逐渐凸显为一片图案,从而使得另一侧的模糊边缘变得清晰明确,直到整个形状结合而成。我们体会到最后图案的出现,却没有感受到处理器实现这一结果的努力过程。这种体会很好地提醒了我们:在我们观看和思考时,许多信息加工处理都在我们意识水平之下反复进行着。
1701551359
1701551360
马尔·伯吉奥模型抓住了大脑对立体视觉计算的要旨,但我们真正的大脑回路要复杂得多。实验已经证明了,当人们被置于违背了唯一性和平滑性假设的人工操控的世界中时,他们观察的能力并不像模型预测得那么差。大脑一定在运用其他信息来帮助解决匹配问题,比方说,眼中的世界就不是散点组成的。大脑能够将所有小斜纹、T形、锯齿形、墨迹斑点以及两眼视觉中的其他点点划划都匹配在一起(这些东西即使对于一个随机散点立体图来说也绰绰有余)。点划之间的错误匹配要比点与点之间的错误匹配少得多,因此需要被排除的匹配数量就显著减少了。
1701551361
1701551362
另一种匹配方式是,利用两只眼睛在几何意义上会给我们带来不同效果的原理,这是达·芬奇注意到的:一个物体有一些部分是一只眼睛能看到而另一只眼看不到的。垂直拿着一支钢笔放在面前,钢笔的夹子朝外呈11点钟方向。当你轮番闭上每只眼睛时,你会发现,只有左眼能看到钢笔夹;右眼看不到,这是因为钢笔夹隐藏到了钢笔其余部分之后。自然选择在设计大脑时是像达·芬奇那么精明,让大脑用这个重要线索来确定物体边缘吗?还是大脑忽略了这个线索,不情愿地将每个错误匹配都记录为物质内聚性假设的例外情况?心理学家肯·中山(Ken Nakayama)和下条绅介(Shinsuke Shimojo)证明了自然选择并没有忽视这条线索。他们设计了一个随机散点立体视图,其深度信息不是以更迭散点排列,而是以一只眼睛能看见而另一只眼睛看不见的位置排列的。那些点位于一个想象中的正方形的四角,一些点只在右眼图像的右上角和右下角,一些点只在左眼图像的左上角和左下角。当人们看这个立体图时,他们看到一个由四点界定的悬浮正方形,这说明大脑确实将只有一只眼能看到的图像解释为空中的边缘。中山与心理学家巴顿·安德森(Barton Anderson)认为,有一些神经元发现了这些阻隔;它们会对一只眼睛见到的一对标记做出反应——其中一个标记能够和另一只眼见到的标记加以匹配,而另一个标记却无法找到配对。这些三维立体的边界探测器会帮助立体网络在悬浮的碎片轮廓中确定位置。
1701551363
1701551364
立体视觉不是两只眼睛凭空具有的,这种回路必须在大脑中布线。我们知道这个情况,因为大约有2%的人每只眼都看得很清楚,但用中央独视眼却看不到;随机散点立体视图对他们来说仍然是平的。另外4%的人只能很模糊地看到立体图。还有更多的一些少数人群有着更特别的欠缺:一些人看不到固定点后的立体深度;另一些人看不到固定点前的立体深度。惠特曼·理查德(Whitman Richards)发现了这些立体视盲形式,他提出假说认为,大脑有三组神经元来检测双眼中点位的差异。一组神经元负责完全巧合或几乎完全巧合的成对的点,为了达到在聚焦点的细致深度知觉。另一组负责鼻子侧面的成对点,这是为了看到更远的物体。第三组神经元则是负责视网膜上接近太阳穴部分的影像,也就是由较近物体所产生的投影。具有所有这些特性的神经元在猴子和猫的脑中都已经被找到了。不同种类的立体视盲似乎是遗传性的,这说明,每组神经元都是由不同的基因组合设置的。
1701551365
1701551366
立体视觉并不是生来就有的,如果在儿童时期或动物幼年时一只眼睛由于白内障或戴眼罩而得不到信息输入,就可能永远不能形成立体视觉。到此为止,这听起来就像一堂乏味的课程,讲述立体视觉就像其他任何东西一样,是先天与后天的混合物。但一个更好的理解方式是:大脑需要组合加工,这种组合加工需要各个项目根据展开的时间表来排程。这个时间表不在乎生物体何时从子宫中脱胎而出;布置顺序可以在出生后再进行。这个过程在关键结合点处还需要基因所无法预测的信息输入。
1701551367
1701551368
立体视觉似乎是在婴儿时期突然出现的。当新生儿按照规律的时间间隔被带到实验室时,他们一周接一周都对立体视图无动于衷,然后突然他们就被吸引住了。在接近那个创纪元式的星期,通常是出生3~4个月后,婴儿开始自然、适当地做出对眼状(例如,当他们自然地跟踪一个放到鼻子前面的玩具时),他们还会觉得彼此冲突的视觉——每只眼睛看到的模式不同——很困惑,而在之前他们会觉得那些很有趣。
1701551369
1701551370
这不是说婴幼儿“学会了立体视觉”。心理学家理查德·海尔德(Richard Held)给出了一个更简单的解释。当婴儿刚出生时,视觉皮质接受层的每个神经元将双眼相应位置的输入累加起来,而不是将这些输入分隔开来。大脑没办法区分某一点的模式来自哪只眼,而只是以一种二维平面的方式,将一只眼睛看到的融汇到另一只眼睛看到的上面去。如果没有关于一个弯曲线来自哪只眼睛这样的信息,立体视觉、会聚性以及对斥性在逻辑上都是不可能的。大约以3个月为界,每个神经元都确定了一只回应的主导眼睛。连接下端的神经元现在可以知晓,一个标志何时落入一只眼睛的一个区域和另一只眼睛的相同区域,或是略微有所转移的区域——这对立体视觉是有利的东西。
[
上一页 ]
[ :1.701551321e+09 ]
[
下一页 ]