1701551500
当形状专家完成工作后,他交给照明专家的是一个组装严丝合缝的白板。照明专家知道,反射光如何依赖于照明、平面的光亮度和平面角度的指导法则。照明专家可以移动一个远处的光源从各个方向照亮这个模型。最优的方向就是,使得每对板尽可能地交汇于一个侧面的视角,就像图4-19中左图的那样,使得操作者尽可能少地涂抹灰色颜料,即可完成工作。
1701551501
1701551502
最后,反射专家——画师——得到了模型。他是最后一个要依靠的专家,他的任务是负责处理剩余的任何图像与模型间的差异之处。他完成任务的方法是,通过在各个平面上涂抹不同阴影的颜料。
1701551503
1701551504
这个程序有用吗?埃德尔森和彭特兰德给了它一张扇折让它来研究。程序显示了它对物体形状的猜测(图4-20第一列),它对光源方向的猜测(图4-20第二列),它对阴影位置的猜测(图4-20第三列)和它对物体如何被涂色的猜测(图4-20第四列)。程序最初的猜测显示在图4-20最上面一行。
1701551505
1701551506
1701551507
1701551508
1701551509
图4-20
1701551510
1701551511
程序最初估计物体是扁平的,像一幅二维绘画一样平置在桌子上,如图4-20第一列顶端所示。很难向你描述这个,因为你的大脑坚持认为看到了一个锯齿形被折叠为具有不同深度的形状。概略图试着显示一些平置在书页上的线条。程序推测光源是从眼睛的方向正对而来(图4-20第二列的顶端)。有了这样平的光照,就没有阴影了(图4-20第三列顶端)。反射专家承担起所有的责任来复制图像,把它画了上去。程序认为它在看一幅画。
1701551512
1701551513
一旦程序有机会调整它的猜测,它调整后的解释如图4-20中间那行所示。形状专家找到了最规则的三维形状(如图4-20左列的侧视图):方板以合适的角度连接在一起。照明专家发现,从上面照光,这使得影子的效果看起来有些像图像一样。最后,反射专家涂抹些颜料对模型做些润色。图4-20中的第四列——锯齿形三维形状、从上面照光,影子在中间,亮条挨着暗条——对应着人们如何解释最初的图像。
1701551514
1701551515
程序还做了任何像人所做的一样的吗?还记得扇折的深度像一个内克尔立方体一样闪变吧。外折变成内折,内折变成外折。程序以一种方式也可以看到这种闪变;闪变的解释显示在最下面一行。程序对两种程序分配了相同的成本,随机到达了其中一种。当人们看到一个三维形状闪变时,他们通常也会看到光源的方向在闪变:顶端向外折,光来自上方;底端向外折,光来自下方。程序也是一样的。不像一个人,程序并不在两种解释之间闪变,但如果埃德尔森和彭特兰德使专家们在一个限制性网络内相互传递它们的猜测(图2-8内克尔立方体网络或是立体视觉模型),而不是像放在一条工厂生产线上一样地单方向传递下来的话,那么这个程序或许也能表现出这样的行为。
1701551516
1701551517
这个作坊的比喻阐明了这个观点:心智是一个模块集合,器官系统或是一个专家社会。专家是需要的,因为专业技能是需要的:心智的问题技术性很强,也太专业化,无法由一个“万金油”来解决。而且一名专家所需的绝大多数信息与另一名专家所需的无甚关联,而是只与他的工作相关。但一名专家独自工作,他会考虑太多的解决方法或是固执地探究一个不可能的方法;在一定程度上,专家们必须协商。许多专家在试图解释一个世界,这个世界与他们的辛苦工作是不相互作用的,既不提供容易的解决方法,也不会制造迷惑偏离轨迹。所以协调管理的主旨在于,将专家们约束到一个预算之内,使不可能的猜测更为昂贵。这就会迫使他们合作做出对世界状态最为可能的综合猜测。
1701551518
1701551520
从二维到三维
1701551521
1701551522
一旦专家们完成了他们的工作,他们会在心智的公告板上贴出什么样的信息,以便大脑的其他部位能够对这些信息进行存取呢?如果我们能够设法从大脑其余部分的视角显示视域,就像假想照相机一样,那会是什么样子呢?这个问题听起来好像一个愚蠢的脑中小人的谬论,但其实不是。它是关于大脑的一个数据表征中的信息和信息所采取的形式。的确,认真考虑这个问题会让我们对心智眼睛的幼稚直觉全新审视。
1701551523
1701551524
立体视觉、动作位移、外形轮廓和阴影方面的专家都努力工作来恢复第三维度。利用他们的劳动果实来构建对世界的三维立体表征,这很自然。我们可以从视网膜上所出现足以描述场景的马赛克信息,来推得有关心智产生这种信息方式的蛛丝马迹。图片变成了比例模型。一个三维模型对应着我们对世界的最终理解。当一个孩子隐隐出现在我们面前时,然后逐渐缩小不见,我们知道,我们不是在奇妙仙境,吃一粒药丸可以让你长大,吃一粒可以让你缩小。我们不像是谚语中的鸵鸟(谚语的真实性有待求证),会以为物体在我们不看或我们被掩盖时就会消失。我们处理现实,因为我们的思想和行动是受一个庞大、稳定而坚实的世界的知识所指导的。或许视觉以一个比例模型的形式给予我们这样的知识。
1701551525
1701551526
比例模型理论本身并没有什么可以质疑的地方。许多计算机辅助设计程序都使用固体物体的软件模型,CAT扫描和MRI仪器使用了复杂的运算来加工信息。一个描述了特定物件的三维空间模型,其内可能拥有一大串为数好几百万的坐标值,而每一组坐标值所描述的,是构成物体的单一迷你方块的位置,这称为方块元素或“体素”来对应于制作图片的图像元素或“像素”。每组三重坐标都对应一对信息,比如在身体某个位置的组织密度。当然,如果大脑中储存了体素,它们就不必被安置在大脑中的三维立方体里,任何更多的体素都被放置在电脑中的三维立方体里。重要的是,每个体素都有一组稳定的神经元专供使用,这样激活模式就能够记录体素的内容了。
1701551527
1701551528
不过,现在是提防小幽灵的时候了。一些软件守护程序、查询运算或神经网络从比例模型中获得信息,这种观点没有问题,只要我们清楚它是直接获得信息的:输入体素的坐标,输出体素的内容。只是不要认为查询运算会看到比例模型,那里漆黑一片,查询者没有晶体、视网膜,甚至没有一个观察点;他在任何地方、也在每个地方。没有投映、没有视角、没有视域也没有啮合。的确,比例模型的存在意义就是为了减少这些恼人的东西。如果你设想一个幽灵,想象在黑暗中一个城市的一个屋子那么大的比例模型。你可以进出其中,从任何方向来到一个大楼,触摸它的外部或将指头伸进窗户或门里探究其中。当你抓住一个大楼,它的侧面总是平行的,无论它伸臂可及还是离得更近。或是想想感觉你手里有一个小玩具的形状,或是嘴里的一块糖果。
1701551529
1701551530
但视觉——即使是大脑千辛万苦才实现的,三维的没有错觉的视觉——却一点儿都不像这样。至多,我们有一个对周遭世界稳定结构的抽象理解;在我们眼睛睁开时,填充我们感知的、旋即而辉煌的色彩感和形式感是完全不同的。
1701551531
1701551532
第一,视觉不是环幕电影院。我们能形象体验到的只是我们眼前的景物;视域周围以外的世界和脑袋后面的世界只是以一种模糊的印象、几乎是用思想推理的方式为我们所知的。我知道我身后有一个书架,面前有一个窗户,但我只看到了窗户,却没看到书架。更糟糕的是,眼睛一秒钟从一点扫过另一点好几次,中央凹瞄准器之外所看到的事物其实非常粗糙。将手举到视线前几厘米处,你根本无法数指头。我不只是在温习眼球构造的解剖学。人们可以想象,大脑根据每一瞥得到的快照来拼一个拼贴画,就像一个全景相机曝光一帧胶卷一样,摄下精确的一部分景物,曝光到邻接的一段胶卷,再继续下去,最后得到一幅无缝的宽角度照片。但大脑不是一台全景相机。实验室研究表明,当人们移动眼睛或头部时,他们立刻就失去了他们刚看到的图像细节。
1701551533
1701551534
第二,我们没有X光的视觉。我们看表面而不是看体积。如果你看到我将一个物体放进一个盒子里或放到一棵树后面,你知道它在哪儿,但却看不到它,也说不出它的细节。同样,这也不只是为了提醒你说你不是超人。我们凡人本可以装备上一个照相机般的记忆,将之前看到的有关信息与现在看到的粘贴在一起来更新三维模型。但我们没有这样的装备。看不到有关具体的视觉细节就不在大脑里了。
1701551535
1701551536
第三,我们看物体时有视角。当你站在两根铁轨之间时,它们似乎交汇于地平线。当然你知道它们没有真的交汇,如果交汇的话,火车就会脱轨。但你不可能看不到它们交汇,尽管你的深度感觉提供了足够的信息使你的大脑能够抵消这个效果。我们还知道,移动的东西会放大和收缩。在一个真正的比例模型中,这些都不会发生。为了准确,视觉系统将视角减少到一定程度。除艺术家之外,其他人很难将桌子的近角投映为锐角,远角投映为钝角;现实中它们看起来都是直角。但铁轨显示视角并没有完全消除。
1701551537
1701551538
第四,在严格的几何意义上,我们看到的是二维,而不是三维。数学家亨利·庞加莱(Henri Poincaré)得出一种确定某个物体维数的简单方法。找一个东西能够将该物体分为两部分,然后数数这个分隔东西的维数再加一。一个点不能被分割,所以它是零维的。一条线有一维,因为它能被一个点分割。一个面有二维,因为它可以被一条线分开,尽管它不能被点分开。一个球有三维,因为任何少于二维的刀片都无法劈开它;一个小球或一根针不能分开它。那么视域呢?它可以被一条线分开。例如,地平线将视域一分为二。当我们站在一条绷紧的电缆前面时,我们所看到每件东西要么在这一边,要么在另一边。圆桌的周长线也分隔了视域:每个点要么在里面,要么在外面。给一条线加一维度你就得到了二维。根据这条标准,视域是二维的。顺便说一句,这并不意味着视域是扁平的。二维平面可以在第三维被弯曲,就像一个橡胶模具或是一个吸塑包装一样。
1701551539
1701551540
第五,我们没有立刻看到“物体”,即那些我们来计数、分类,并冠以名词标签的可移动物质块。就视觉而言,它甚至不清楚物体是什么。当戴维·马尔考虑如何设计一个能够发现物体的计算机视觉系统时,他不得不问:
1701551541
1701551542
鼻子是一个物体吗?脑袋算吗?如果它接到身体上还算吗?一个骑在马背上的人呢?这些问题说明,划分影像区域是一个多么困难的问题,其困难程度几乎与哲学问题不相上下。其实这些问题没有答案——所有这些东西可以是一个物体,如果你愿意那样想它们的话,或者它们也可以是一个更大物体的一部分。
1701551543
1701551544
一滴强力胶可以将两个物体变成一个,但视觉系统没办法知道这一点。
1701551545
1701551546
然而,我们对它们之间的表面和边界却有着非常明显的感觉。心理学中最著名的错觉来自大脑永无止境地竭力将视域雕刻为平面,并决定哪一个在另一个的前面。一个例子是鲁宾的人脸-花瓶(Rubin face-vase,见图4-21),图像在一个高脚杯和一对两人面对面的轮廓之间闪变。人脸与花瓶不能被同时看到(即使有人想象两人用他们的鼻子举起高脚杯也不行),无论哪个形状主导“拥有”了区分界线,都将另一片限制作为模糊的背景。
1701551547
1701551548
1701551549
[
上一页 ]
[ :1.7015515e+09 ]
[
下一页 ]