1701551520
从二维到三维
1701551521
1701551522
一旦专家们完成了他们的工作,他们会在心智的公告板上贴出什么样的信息,以便大脑的其他部位能够对这些信息进行存取呢?如果我们能够设法从大脑其余部分的视角显示视域,就像假想照相机一样,那会是什么样子呢?这个问题听起来好像一个愚蠢的脑中小人的谬论,但其实不是。它是关于大脑的一个数据表征中的信息和信息所采取的形式。的确,认真考虑这个问题会让我们对心智眼睛的幼稚直觉全新审视。
1701551523
1701551524
立体视觉、动作位移、外形轮廓和阴影方面的专家都努力工作来恢复第三维度。利用他们的劳动果实来构建对世界的三维立体表征,这很自然。我们可以从视网膜上所出现足以描述场景的马赛克信息,来推得有关心智产生这种信息方式的蛛丝马迹。图片变成了比例模型。一个三维模型对应着我们对世界的最终理解。当一个孩子隐隐出现在我们面前时,然后逐渐缩小不见,我们知道,我们不是在奇妙仙境,吃一粒药丸可以让你长大,吃一粒可以让你缩小。我们不像是谚语中的鸵鸟(谚语的真实性有待求证),会以为物体在我们不看或我们被掩盖时就会消失。我们处理现实,因为我们的思想和行动是受一个庞大、稳定而坚实的世界的知识所指导的。或许视觉以一个比例模型的形式给予我们这样的知识。
1701551525
1701551526
比例模型理论本身并没有什么可以质疑的地方。许多计算机辅助设计程序都使用固体物体的软件模型,CAT扫描和MRI仪器使用了复杂的运算来加工信息。一个描述了特定物件的三维空间模型,其内可能拥有一大串为数好几百万的坐标值,而每一组坐标值所描述的,是构成物体的单一迷你方块的位置,这称为方块元素或“体素”来对应于制作图片的图像元素或“像素”。每组三重坐标都对应一对信息,比如在身体某个位置的组织密度。当然,如果大脑中储存了体素,它们就不必被安置在大脑中的三维立方体里,任何更多的体素都被放置在电脑中的三维立方体里。重要的是,每个体素都有一组稳定的神经元专供使用,这样激活模式就能够记录体素的内容了。
1701551527
1701551528
不过,现在是提防小幽灵的时候了。一些软件守护程序、查询运算或神经网络从比例模型中获得信息,这种观点没有问题,只要我们清楚它是直接获得信息的:输入体素的坐标,输出体素的内容。只是不要认为查询运算会看到比例模型,那里漆黑一片,查询者没有晶体、视网膜,甚至没有一个观察点;他在任何地方、也在每个地方。没有投映、没有视角、没有视域也没有啮合。的确,比例模型的存在意义就是为了减少这些恼人的东西。如果你设想一个幽灵,想象在黑暗中一个城市的一个屋子那么大的比例模型。你可以进出其中,从任何方向来到一个大楼,触摸它的外部或将指头伸进窗户或门里探究其中。当你抓住一个大楼,它的侧面总是平行的,无论它伸臂可及还是离得更近。或是想想感觉你手里有一个小玩具的形状,或是嘴里的一块糖果。
1701551529
1701551530
但视觉——即使是大脑千辛万苦才实现的,三维的没有错觉的视觉——却一点儿都不像这样。至多,我们有一个对周遭世界稳定结构的抽象理解;在我们眼睛睁开时,填充我们感知的、旋即而辉煌的色彩感和形式感是完全不同的。
1701551531
1701551532
第一,视觉不是环幕电影院。我们能形象体验到的只是我们眼前的景物;视域周围以外的世界和脑袋后面的世界只是以一种模糊的印象、几乎是用思想推理的方式为我们所知的。我知道我身后有一个书架,面前有一个窗户,但我只看到了窗户,却没看到书架。更糟糕的是,眼睛一秒钟从一点扫过另一点好几次,中央凹瞄准器之外所看到的事物其实非常粗糙。将手举到视线前几厘米处,你根本无法数指头。我不只是在温习眼球构造的解剖学。人们可以想象,大脑根据每一瞥得到的快照来拼一个拼贴画,就像一个全景相机曝光一帧胶卷一样,摄下精确的一部分景物,曝光到邻接的一段胶卷,再继续下去,最后得到一幅无缝的宽角度照片。但大脑不是一台全景相机。实验室研究表明,当人们移动眼睛或头部时,他们立刻就失去了他们刚看到的图像细节。
1701551533
1701551534
第二,我们没有X光的视觉。我们看表面而不是看体积。如果你看到我将一个物体放进一个盒子里或放到一棵树后面,你知道它在哪儿,但却看不到它,也说不出它的细节。同样,这也不只是为了提醒你说你不是超人。我们凡人本可以装备上一个照相机般的记忆,将之前看到的有关信息与现在看到的粘贴在一起来更新三维模型。但我们没有这样的装备。看不到有关具体的视觉细节就不在大脑里了。
1701551535
1701551536
第三,我们看物体时有视角。当你站在两根铁轨之间时,它们似乎交汇于地平线。当然你知道它们没有真的交汇,如果交汇的话,火车就会脱轨。但你不可能看不到它们交汇,尽管你的深度感觉提供了足够的信息使你的大脑能够抵消这个效果。我们还知道,移动的东西会放大和收缩。在一个真正的比例模型中,这些都不会发生。为了准确,视觉系统将视角减少到一定程度。除艺术家之外,其他人很难将桌子的近角投映为锐角,远角投映为钝角;现实中它们看起来都是直角。但铁轨显示视角并没有完全消除。
1701551537
1701551538
第四,在严格的几何意义上,我们看到的是二维,而不是三维。数学家亨利·庞加莱(Henri Poincaré)得出一种确定某个物体维数的简单方法。找一个东西能够将该物体分为两部分,然后数数这个分隔东西的维数再加一。一个点不能被分割,所以它是零维的。一条线有一维,因为它能被一个点分割。一个面有二维,因为它可以被一条线分开,尽管它不能被点分开。一个球有三维,因为任何少于二维的刀片都无法劈开它;一个小球或一根针不能分开它。那么视域呢?它可以被一条线分开。例如,地平线将视域一分为二。当我们站在一条绷紧的电缆前面时,我们所看到每件东西要么在这一边,要么在另一边。圆桌的周长线也分隔了视域:每个点要么在里面,要么在外面。给一条线加一维度你就得到了二维。根据这条标准,视域是二维的。顺便说一句,这并不意味着视域是扁平的。二维平面可以在第三维被弯曲,就像一个橡胶模具或是一个吸塑包装一样。
1701551539
1701551540
第五,我们没有立刻看到“物体”,即那些我们来计数、分类,并冠以名词标签的可移动物质块。就视觉而言,它甚至不清楚物体是什么。当戴维·马尔考虑如何设计一个能够发现物体的计算机视觉系统时,他不得不问:
1701551541
1701551542
鼻子是一个物体吗?脑袋算吗?如果它接到身体上还算吗?一个骑在马背上的人呢?这些问题说明,划分影像区域是一个多么困难的问题,其困难程度几乎与哲学问题不相上下。其实这些问题没有答案——所有这些东西可以是一个物体,如果你愿意那样想它们的话,或者它们也可以是一个更大物体的一部分。
1701551543
1701551544
一滴强力胶可以将两个物体变成一个,但视觉系统没办法知道这一点。
1701551545
1701551546
然而,我们对它们之间的表面和边界却有着非常明显的感觉。心理学中最著名的错觉来自大脑永无止境地竭力将视域雕刻为平面,并决定哪一个在另一个的前面。一个例子是鲁宾的人脸-花瓶(Rubin face-vase,见图4-21),图像在一个高脚杯和一对两人面对面的轮廓之间闪变。人脸与花瓶不能被同时看到(即使有人想象两人用他们的鼻子举起高脚杯也不行),无论哪个形状主导“拥有”了区分界线,都将另一片限制作为模糊的背景。
1701551547
1701551548
1701551549
1701551550
1701551551
图4-21
1701551552
1701551553
另一个例子是卡尼莎三角形(Kanisza triangle,见图4-22),本来什么都没有,却组成了一个像真的,仿佛用墨水铭刻在其中的形状。
1701551554
1701551555
1701551556
1701551557
1701551558
图4-22
1701551559
1701551560
人脸、花瓶和三角形都是熟悉的物体,但错觉并不依赖于它们的熟悉性;毫无意义的斑块同样具有震撼力(见图4-23)。
1701551561
1701551562
1701551563
1701551564
1701551565
图4-23
1701551566
1701551567
我们并不是主动地感知到平面,而是被我们视网膜中涌现出的信息所驱使的;与流行的观点恰恰相反,我们并不是看到我们所希望看到的。
1701551568
[
上一页 ]
[ :1.701551519e+09 ]
[
下一页 ]