1701551646
形状是识别物体的重要线索
1701551647
1701551648
物体将参考框架引向自己的能力有助于解决视觉中的一个重大问题,也就是我们由基本的视网膜成像向上探索到抽象思考的过程里,必须面对的下一个问题——人们如何识别形状。一个普通成年人知道大约一万个物品的名字,其中绝大多数是凭借形状来区分的。甚至一个6岁的小孩也能叫出几千个物品的名字,学习效率为每几个小时就学会一个(从0~6岁)。当然,物体可以用许多线索来识别。有些可以用声音和味道来识别。而另一些,比如篮子里的衬衫,则只能根据它们的颜色和质地来识别。但大多数物体能够根据它们的形状来识别。我们在识别物体形状时,我们就像是一个纯粹的几何学家,研究空间中物质的分布并找到记忆中最接近的匹配。心理几何学家一定足够精明,因为一个3岁的孩子就能够仔细检查一盒动物饼干或是一堆鲜艳的塑料片,并根据它们的外形轮廓滔滔不绝地念叨出这些奇异动物的名称。
1701551649
1701551650
图1-6说明了为什么这是一个难度很高的问题。当物体或观看者移动时,二维半草图中的轮廓就变化了。如果你对形状的记忆——比如说箱子——是你最初看时的那个二维半草图的拷贝,那么移动后的版本就不再匹配了。你对箱子的记忆是“一个长方形的厚板和一个处于12点钟方向的水平把手”,但你现在看的把手不是水平的,也不在12点钟方向。你会目光茫然,不知道它是什么(见图4-29)。
1701551651
1701551652
1701551653
1701551654
1701551655
图4-29
1701551656
1701551657
但假定你的记忆文件没有使用视网膜参考框架,而使用的是与物体本身校准的一个框架。你对箱子的记忆会是“一个长方形的厚板,有一个与厚板边缘平行且在厚板顶端的把手”。“厚板顶端的”部分意味着你记着那部分相对于物体本身的位置,而不是相对于视域的位置。然后,当你看到一个不认识的物体时,你的视觉系统会自动在上面校准一个三维参考框架,就像在阿滕尼夫的正方形和三角形合唱团式排列中所做的一样。现在当你看到的与你所记得的匹配一致时,这两个就符合了,无论箱子的方向如何。你认出了你的箱子(见图4-30)。
1701551658
1701551659
1701551660
1701551661
1701551662
图4-30
1701551663
1701551664
简而言之,这是马尔如何解释形状识别的。他的核心想法是,形状记忆不是一个二维半草图的拷贝,而是以一种与之有两方面不同的格式加以储存的。首先,坐标系统以物体为中心——而不是像在二维半草图中一样,以观看者为中心。要识别一个物体,大脑要根据它的延长线和对称轴校准一个参考框架,并测量在这个参考框架中那部分的位置和角度。只有那时,视觉和记忆才得以匹配。第二处不同是,匹配者并不是将视觉和记忆一个像素一个像素地比较,就好像将一个拼图片放到一个缝隙中一样。如果那样的话,本该匹配的形状仍旧可能匹配不上。真正的物体有凹痕和摆动,而且有着不同的风格和模式。任何两个箱子的大小都不会完全相同,有的是圆角,有的是扁平把手或细长把手。所以要匹配的形状表征不应当是死板地记录下物体表面的每一个起伏。它应当归于较宽大的类别如“厚板”和“U形的东西”。附属件也不能确切到毫米,而应当允许一些和稀泥的情况:不同杯子的把手都在“侧面”,但可能有的杯子把手高些,有的低些。
1701551665
1701551666
心理学家埃尔夫·比耶德曼(Irv Biederman)将马尔的两个观点形象化为一些简单的几何部件,他称其为“几何离子”,类比组成原子的质子和电子。图4-31展示了5个几何离子和它们的一些组合。
1701551667
1701551668
1701551669
1701551670
1701551671
图4-31 几何离子
1701551672
1701551673
比耶德曼一共列出了24个几何离子,包括一个圆锥、一个喇叭筒、一个橄榄球、一根管子、一个立方体和一段通心粉状弯件。从技术上讲,它们都是不同种类的锥体。如果一个冰激凌锥体是由一个其中心沿着一条直线移动的扩展圆扫出的平面,那几何离子就是由其他二维形状在沿着直线或曲线移动时,扩展或收缩而扫出的平面。几何离子用几个附加的关系如“上面”“旁边”“端对端”“端到偏离中心”以及“平行”就可以组合成物体。这些关系由以物体为中心的参考框架来界定(当然不是视域);“上面”意为“主要几何离子的上面”,而不是“凹槽的上面”。所以当物体或观看者移动时,关系仍保持不变。
1701551674
1701551675
几何离子是组合的,就像语法一样。显然我们并不是用语言来向自己描述形状的,但几何离子组合是一种内部语言,是一种心理语言的方言。一些固定词汇的元素组合在一起构成了更大的结构,就像单词构成了词组和句子。句子不是单词的累加,而是要根据它们的句法进行组合;人咬狗不等同于狗咬人。与之类似,物体也不是它的几何离子的累加,而是要依赖于它的空间布局;一个圆筒边上有个弯手就是茶杯,一个圆筒顶上有个弯手就是提桶。就像少量的单词和规则组合成的句子数量是个天文数字一样,少量的几何离子和附件也组合成具有天文数字数量的物体。根据比耶德曼的说法,每24个几何离子分别有着15种大小和构造(有扁平的,有细长的),有81种方式组合它们。这就使得两个几何离子可以构成10497600种物体,3个几何离子可以构成3060亿种物体。从理论上讲,这足以超过我们所知道的几万种形状了。在实践中,仅用3个,甚至常常是两个几何离子,就很容易建成可以即刻识别出的日常物体的模型。
1701551676
1701551677
语言与复杂形状看起来更像是大脑中的邻居。左半脑不仅负责语言功能,还具有识别和想象由布置各部件而界定形状的能力。一位左半脑中风的神经系统患病者报告说:“当我试着想象一棵植物、一种动物或一个物体时,我只能回忆起一部分。我的内部视觉短暂且支离破碎;如果让我想象一头牛的头,我知道它有耳朵和角,但却想象不出它们的具体位置。”相对而言,右半脑负责测量整个形状;它能够轻易判断出一个长方形的高是否比宽更长,或者一个点在一个物体的一厘米之外还是之内。
1701551678
1701551679
几何离子理论的一个优点是,它对二维半草图的要求不是不合理的。将物体雕刻成部件、给部件贴上几何离子的标签,以及确定它们的布置,这些并不是不可克服的问题,而且视觉研究者已开发出了大脑如何来解决这些问题的模型。它的另一个优点是,对物体结构的描述有助于心智来考虑物体,而不仅是为了脱口叫出它们的名字。人们通过分析物体部件的形状和排列方式,从而理解物体运行的方式以及它们的作用。
1701551680
1701551681
几何离子理论认为,心智在最高水平的知觉,是将物体和部件“看”作理想化的几何固体。这就解释了人类视觉审美中一个长期被注意到的、令人好奇的事实。任何曾经参加过人体绘画班或去过裸体海滩的人都会迅速明白,真实的人体不像我们想象中的那样甜美。我们绝大多数人穿上衣服会更好看些。艺术史学家奎恩廷(Quentin Bell)在他的时尚史课程中给出的解释可能就是源自于几何离子理论:
1701551682
1701551683
如果我们将一个物体包在某种纸袋中,这样凭借眼睛推断而非看到封存其中的物体,这个推断或想象的形式很可能比它被拆封后显现的样子更加完美。因此,一个用棕色纸盖着的方盒子可能会被想象成一个完美的正方形。除非心智得到了一些非常有力的线索,否则它不会想象到小洞、凹陷、裂纹或是其他一些特殊的质地。同样,如果我们将一块绸缎搭在大腿、腿部、胳膊或乳房上,它会被想象成具有完美的形态;一般不会想象到我们根据经验应当估计出的不规则形状和不完美之处。
1701551684
1701551685
我们知道,根据经验身体大概会是什么样子,但我们愿意搁置我们的怀疑,而倾向于人类的服装所虚构的想象。我认为,我们确实在自我欺骗的行为上付出了更多的心力。当我们套上我们最好的夹克,看到我们乏善可陈的肩膀被很艺术化地放大并具有了理想的形状时,我们的确,至少在短时间内提升了自己的自尊。
1701551686
1701551687
几何离子也不是万灵丹。许多自然的物体,比如山和树,有着复杂的不规则分形形状,但几何离子将它们变作金字塔和棒棒糖。还有,尽管几何离子能够被构建为一个还凑合的普通人脸,像个雪人,但它几乎不可能构建一张特定脸的模型——约翰的脸,你奶奶的脸——这张脸有充分的不同,也不至于和其他脸混淆,但无论是微笑还是皱眉,发福还是衰老,这张脸都足够稳定,使得这个人总可以被认出来。许多心理学家认为,面部识别是特殊的。在我们这样的社会性物种中,面部非常重要,因而自然选择赋予了我们一个处理器,可以来记录所需的各种几何轮廓和比例,从而将之区分开来。婴儿在仅仅刚出生30分钟后,就会被脸部模样的模式所吸引,但对其他复杂和对称的布置安排却没什么兴趣,他们还迅速学会了认出母亲,大概早在生命的第二天就能做到了。
1701551688
1701551689
面部识别甚至可能使用大脑的专门部件。失去识别面部的能力被称为面容失认症。这和奥利弗·萨克斯(Oliver Sacks)著名的“错把老婆当帽子”的病例还不同:面容失认症患者能够将帽子和脸部区分开来;他们只是说不出它是谁的脸。但他们中的许多人都能认出帽子和几乎其他任何东西。例如,患者LH由心理学家南希·埃特科夫(Nancy Etcoff)和凯勒·凯夫(Kyle Cave)及神经病学家罗伊·弗里曼(Roy Freeman)进行测试。LH是一个聪明、知识渊博的人,他在测试前20年发生的一次车祸中头部遭到创伤。自那次事故后,他就完全认不出人脸了。他认不出他的妻子和孩子(除非通过声音、气味或者步态),他也认不出镜子中他自己的脸,或是照片中的明星(除非他们有个像爱因斯坦、希特勒和披头士乐队在其全盛时期那样的标志性视觉特征)。他并不是辨别不出面部细节;他能够将他们的特征与整个面容对上号,即使在朦胧的侧光下也能做到,他还可以判断他们的年龄、性别和美丽程度。他实际上可以正常地认出不是脸的复杂物体,包括单词、衣服、发型、车辆、工具、蔬菜、乐器、办公座椅、眼镜、光点图形和像电视天线一样的形状。只有两种形状对他来说有些困难。他感到很尴尬,他不能叫出他孩子的动物饼干的名称;与之类似,在实验室中,他识别动物图画的水平也位居下游。他还在识别诸如皱眉、讥笑、恐惧神情等面部表情时感到困难。但无论是动物还是面部表情,对他来说,都不像识别脸那样困难,脸对于他来说完全是空白的。
1701551690
1701551691
脸对于我们的大脑来说并不是识别起来最困难的东西,以至于大脑一旦出现故障,脸部识别会最先受损。心理学家玛兰妮·伯赫曼(Marlene Behrmann)、莫里斯·莫斯克布维奇(Morris Moscovitch)和戈登·维纳克(Gordon Winocur)研究了一个头部被一辆经过卡车的后视镜击中的年轻人。他识别日常事物有困难,但识别脸却没问题,即使脸上有眼镜、假发、胡须做遮盖也可以被他认出。他的症状与面容失认症刚好相反,这说明脸部识别只是与物体识别有所不同,而非更加困难。
1701551692
1701551693
那么面容失认症是因为面部识别模块受损了吗?一些心理学家注意到,LH和其他面容失认症患者在识别其他一些形状时有些困难,所以他们认为,面容失认症患者处理一些对于识别面部很关键的几何特征有困难,而这些几何特征对于识别某些其他形状也有作用。我觉得,区分识别面部和识别具有面部几何特征的物体是没有意义的。从大脑的角度来说,没有什么东西是一张脸,直到它被识别出来时它才是一张脸。有关一个知觉模块唯一特殊的东西是它要注意的几何特征,比如对称的两团泡泡的距离,或是撑在一个三维支架上的、里面塞着下层软垫和连接管的、两维弹性表面的弯曲模式。如果除了脸之外的其他物体(动物、面部表情甚至汽车)也具有一些这种特征,这个模块就只能分析它们了,即使它们对于脸是最有用的。将一个模块称为脸部识别器,并不是说它只能够处理脸部;而是说它是根据区分脸的几何特征而优化设计的,因为这个器官在演化历史中被选择具有了识别它们的能力。
1701551694
[
上一页 ]
[ :1.701551645e+09 ]
[
下一页 ]