1700526710
——托马斯·亨利·赫胥黎
1700526711
1700526712
先天内置型知识
1700526713
1700526714
一个实体执行简易模式的方法总是出乎意料——全面的递归搜索、大量的并行模式识别、迅速的迭代进化,但没有知识,一切都是空谈。即使是最直截了当地执行上述三种模式,也需要在开始时有知识的引导。利用递归法的下棋程序中包括棋局规则的知识;利用神经网络的模式识别系统在正式学习范例之前,至少还需要一份大纲作为学习的开端;进化算法的改进也需要一个起点。
1700526715
1700526716
这几种简易模式功能强大,但开始时都需要知识来播种才能生根发芽、枝繁叶茂。算法的选择、组成部分的形状与拓扑结构、关键数值等都属于某一层次的知识。即使还未正确建立连接和反馈回路,神经网络的学习也并不会因此停滞。
1700526717
1700526718
这部分知识是我们与生俱来的,人脑记录着我们成长中的经历体验,但这不等于它在生命之初是块白板。事实上,它由负责不同功能的特定区域综合而成:
1700526719
1700526720
·高度并行的早期视觉回路擅于识别视觉变化;
1700526721
1700526722
·大脑皮层中的视觉神经细胞群可识别边、直线、曲线、形状、熟悉的物体与面孔;
1700526723
1700526724
·大脑皮层中的听觉回路可听辨不同频率组成的声波;
1700526725
1700526726
·大脑内的海马状突起能储存感官体验相关的记忆;
1700526727
1700526728
·扁桃体包含的回路可将恐惧转化成一系列警觉信号,触发大脑的特定区域。
1700526729
1700526730
大脑的内部连接错综复杂,不同区域分管处理不同类型的信息,这也正是人脑能自如应对复杂多样的环境的奥妙所在。现代人工智能专家明斯基和西蒙·派珀特是这样描述人脑的:“它由大量小型分散系统组成,根据胚胎学排列组合成一个复杂的体系。它有一部分受一系列后天增加的符号系统控制(仅是部分控制)。”他们还认为:“由于自身的特性,这些亚符号系统完成了大部分工作,并与其他部分隔离,以防其他部分了解其工作原理。这就能解释为什么人们能下意识地完成许多工作,却道不出其中的原理。”
1700526731
1700526732
获得型知识
1700526733
1700526734
将当下的深刻见解铭记于心以应对未来的挑战,这是明智的做法,但反复纠结每一个问题并无意义。对于人脑来说尤其如此,因为人脑的计算回路太缓慢了。虽然在重新思考之前的深刻见解时,电脑比人脑技高一筹,但在大生态环境下,我们的电子竞争者们仍需要审慎、明智、平衡地利用其存储和计算功能。
1700526735
1700526736
早在20世纪60年代中期,人们就尝试给机器灌输有关世界的各种知识,直至70年代,这项工作已然成为人工智能研究的重点。灌输知识的过程中需要人类“知识工程师”和医生、律师等各领域专家的共同协作。知识工程师会采访各个专业的专家,确保自己对这方面的知识理解无偏差,之后手动将这些知识进行编码,与合适的电脑语言匹配起来。就拿糖尿病来说,知识库中可以找到的相关内容包括:胰岛素是血液的一部分;胰岛素由胰脏分泌;胰岛素可从外部注射;胰岛素偏低会导致血液中血糖含量升高;血糖长期保持较高水平会对视网膜造成不良影响……我们在一个系统中编入成千上万条类似的知识链接,并结合递归式搜索引擎建立各链接间的关联,那么这个系统便能独立进行判断和运作了。
1700526737
1700526738
专家系统最成功和最典型的例子便是20世纪70年代的MYCIN系统,该系统可协助诊断有关脑膜炎的复杂病例。《美国医学会杂志》上发表了一篇极具历史意义的研究报告,其中提到MYCIN系统的诊断医疗手段与人类医生不相上下,有时甚至能超越人类医生。1MYCIN系统中采用了一些创新手段,最典型的便是“模糊逻辑”(fuzzy logic)的运用,这一逻辑能帮助系统在证据和规则不明晰的情况下进行推理诊断,涉及的MYCIN系统运行规则如下:
1700526739
1700526740
MYCIN第280条规则:如果同时满足(ⅰ)感染的病为脑膜炎,(ⅱ)真菌型感染,(ⅲ)培养皿中的着色剂上未发现有机体,(ⅳ)患者非易感染病患,(ⅴ)曾去过球孢子虫病疫区,(ⅵ)患者为黑人、亚洲人或印第安人,(ⅶ)检验中隐球菌抗原呈阴性,则可判定该有机体的感染有50%的概率是由隐球菌引起的。
1700526741
1700526742
MYCIN专家系统和其他科研系统的成功迅速催生了一项知识——工程产业,该产业的市场价值从1980年的区区400万美元一路飙升至今天的几十亿美元。2
1700526743
1700526744
但这一研究方法明显存在许多困难。其中一个便是庞大的知识库转入电脑系统时遭遇瓶颈,因为这些信息必须依靠人工一字一句手动输入系统,并逐一建立连接关系。即使将学科范围缩至最小,其涉及的知识范围依旧浩如烟海,并且专家们在关于这些知识如何做决策的问题上也道不出个所以然来。这一点我们在上一章已讨论过,它与人脑内知识的分散特性有关。
1700526745
1700526746
另一个问题便是这一计算机系统的脆弱性。整个知识库太复杂了,那些知识工程师不可能对知识中的异常状况做出预测。正如明斯基所言:“只要是鸟就会飞,除非它是企鹅或鸵鸟,或是它不幸死了,或是它翅膀受伤了,或是被关在了笼子里,或是它的双脚陷在了水泥里,或是可怕的经历让它对飞行产生了心理恐惧……”
1700526747
1700526748
我们需要将知识——习得的过程自动化,才能在机器中建立灵活多变的智能体系。研究学习的主要目的在于将各个自组织方法——递归法、神经网络、进化算法有效且稳定地组合起来,从而让系统模拟并理解人类语言和知识。于是,机器便可以自行投资、阅读和学习。最终,这些系统也会像人类一样,在问题超出自己的专业范围时进行杜撰,冒充行家。
1700526749
1700526750
用语言表达知识
1700526751
1700526752
没有一种知识可以用只言片语概括,也没有一种知识是完全无法言喻的。
1700526753
1700526754
——西蒙·派珀特
1700526755
1700526756
筌者所以在鱼,得鱼而忘筌;蹄者所以在兔,得兔而忘蹄;言者所以在意,得意而忘言。吾安得夫忘言之人而与之言哉!
1700526757
1700526758
——庄子
1700526759
[
上一页 ]
[ :1.70052671e+09 ]
[
下一页 ]