1704829210
1704829211
当人们在理论上堂吉诃德式地夸耀计算机的力量时,真实的信息系统的表现却一个接着一个地令人惭愧和失望。计算机是惟一注定会在正常运行中经常发生意外事故的工业产品。维护信息系统的费用几乎总是被低估了,甚至可以说这是现代商务的惯例。
1704829212
1704829213
具体说来,正是软件这个东西,我们不可能照预计的价格来控制它,不过那只是一定类型的软件。硬件会以摩尔定律的指数形式变得更小、更快、更便宜。正是这么飞速的进步点燃了狂热夸张的激情。封闭系统的软件,有着小巧而且可以固定下来的不变的界面,也能做得很可靠,但不会很便宜。这类软件的一个例子是驱动现代飞机(如空中客车)的密码。那类我们似乎还不能控制的软件,有着复杂而且随周围环境改变的界面。例子是个人计算机软件,都知道那是很难控制的。重要的是不要混淆这两类软件。20世纪末广泛流行着一种奇怪的妄想,说千年虫(Y2K bugs)会产生大规模的破坏。破坏没有发生,原因是多数基础软件都是可以控制的,虽然代价很高。
1704829214
1704829215
未来50年里,计算机科学中的这两种趋势——能力的夸大和代价的低估——可能还会继续下去。这种景象大概可以叫“帮助台的行星”,生在其中的人们将费巨大的力气来维护十分庞大的软件系统。99这个景象倒不是一点儿吸引力也没有,因为它能让人的力量得到充分的发挥。暗淡的未来是逃避不了的,不过我们还是值得想象一个可能带来崭新东西的计算机科学的新时期。
1704829216
1704829217
首先,计算机科学必须回到起点,重新考虑信息与物理过程的关系。香农破天荒地将可以测度的信息量与物理系统的熵联系起来,但这个孤立的公式容易使人误解。实际上,并不是所有信息量都能测度,因而有些信息会比其他信息更重要。物理系统中多数有可能被测度的信息量实际上都在统计分布的海洋中丢失了。20世纪后期有个流行的比喻说,蝴蝶轻轻抖动一下翅膀,几个星期以后也许能在地球的另一端引发大风暴。与这种观念相关的一个问题是,即使它偶尔是对的,也没有那么多风暴来回应那么多的蝴蝶。100我们也许可以说可测的信息有着不同的“因势”101。香农的信息大概应该重新命名为“势信息”。如果一个信息单元很重要——就是说,它有很高的因势——就一定要研究它;它必然是系统的关键部分。这产生了有时被称作“语义学”的东西,也就是计算能在其中显出意义的那个环境。
1704829218
1704829219
在计算机科学里也总是存在一个观测者的问题(只是偶尔被承认)。为了表述这个问题,一种办法是考虑某个对人类语言、历史和文化一无所知的异类生命。那些异类不可能漂浮在星际空间编一本莎士比亚戏剧,同样也不可能可靠地重构一台孤立的个人电脑的意义和功能。
1704829220
1704829221
这不是遥远的理论问题,而是急迫的实际问题。由于当前人类工程师具体分析和控制软件的能力限制了软件的复杂性,可以说,我们已经达到了我们所知软件的复杂性的顶点。如果不寻求新的软件思想和设计途径,那么,不论处理器变得有多快、多丰富、多奇特,我们也写不出超过千万行代码的程序。
1704829222
1704829223
在20世纪中叶计算机科学的黎明,我们惟一的直观感觉的信息经验是通过线路来发送脉冲。早期形式的信息论——在标准课程里至今仍然占着统治地位——关心的是线路末端世界的一个个采样点。于是,如我们所知,计算机的结构设计就围绕着这些模拟线路。源代码是对脉冲的模拟,它可以像传递的变量或者消息那样连续地向线路发送出去。
1704829224
1704829225
为了让一根线上的脉冲有意义,需要一个协议来根据信号的顺序为它赋予某种意义。计算机科学的前半个世纪几乎就是在这样的协议激发下走过的。当然有成功的,如开通互联网的协议。但这不是自然系统的工作方式。虽然在理论上我们可以用20世纪的算术协议来解释视觉皮层从光学神经接收到信号以后的行为,但这种做法会在我们完全不可能把握的尺度上涉及巨大的复杂性。显然,协议的遵守并不能有效解释同时接收大量输入信号的系统,而且可能也不足以设计庞大的系统。如果我们以一个能在多点取样的面来替代线的概念,那么我们必须脱离算术协议而走进一套新的技术,包括模式的分类、绝对确定的预测模型的自动维护。
1704829226
1704829227
当前的一个实际问题可以说明这一点:我多年来和外科医生一起做模拟模型,以帮助他们为特定的病人制定医疗方案。以今天的标准看,模型很复杂。为了保证它们有用,每一个模型都由有多年经验的专家群体建立和维护,而且都必须经过几千个病人的检验。
1704829228
1704829229
现在,假定某医学院的一个小组用10年的时间做出了绝妙的虚拟心脏,显示了良好的手术应用前景。同时,在另一个学院,一个类似的小组用10年时间研究了虚拟肺。我们假定,两个小组愿意把他们的成果结合在一个虚拟的胸腔里。
1704829230
1704829231
两个小组几乎肯定会运用互不相容的协议。他们不但可能选择不同的基本机器、操作系统、执行语言等,还可能走不同的概念路线。也许一个小组强调维护整体的、自上而下的约束,而另一个小组喜欢自下而上的组织法则。一个小组可能强调对象的语义学,另一个小组则试图逼近一个连续的系统。在当前的技术水平下,两个小组可以就能在它们之间传达的线路信号达成一个协议。这样的协议是有问题的;在这种情形,复杂性也许只能起着某种抑制作用。几年后我们会明白的,目前正在努力。如果可能有器官之间的协议,那么达成一个协议就等于被迫在器官模拟技术上做一次可悲的交易。一个工作协议几乎肯定会损害我们改进任何相关组成器官模拟的前景。
1704829232
1704829233
为了理解为什么会这样,我们需要深入信息系统遗留的问题。最能刻画我们时下软件的形容词是“脆弱”,崩溃了也不会屈服。这是过分遵守协议的结果,那原本是一个不可原谅的要求。因为这些根本的脆弱性,软件是一层层搭建起来的,为了发掘那些已经为众多用户以不同方式所依赖的协议,还不知道有多复杂,需要花多少钱。于是我们有了“锁定”现象:有些软件实际上成了强制性的。锁定现象被20世纪末的软件销售者们操纵着,为他们带来了有史以来最大的财富。
1704829234
1704829235
除了锁定,软件还有更令人讨厌的特征,我称它为“沉淀”。在软件沉淀的过程中,协议连同嵌在协议里的思想都成了强制性的。文件的思想就是一个例子。大约1984年前,人们还在争论文件是不是好办法。有些计算机科学家觉得共享的信息最好能有细粒化的结构——也就是一个由字母似的基本小单元构成的单独的整体文件。实际上,第一代国际版的Macintosh计算机并没有使用文件。102可是,发行版的Macintosh有了文件,而且Windows、Unix和其他几种广泛应用的系统也都有了文件。现在我们将文件作为像光子一样基本的严峻现实告诉学生,尽管它们是人类发明的。
1704829236
1704829237
回头来看虚拟的心和肺。一旦两个工程小组达成了协议,那协议就成为他们的主人,因为他们不得不同时改变自己来修正它;那是一个复杂而昂贵的任务,实际上是不可能的。不论协议达成的时候流行什么样的关于器官联络的思想,它都会“沉淀”下来。思想也就停止了。
1704829238
1704829239
因此,未来50年计算机科学的一个美好愿望是为大系统的组成寻求一种新的联络方法,以取代对协议的依赖。在心和肺的情形,那种方法已经隐约显露出来了。
1704829240
1704829241
我们设想,每个器官都认为另一个是真实的血肉器官,连接着一个真实的传感器。每个器官可以测量另一个器官里的基本性质,如温度、压力和在时间和空间的某个点的化学组成。每个器官在另一个器官看来都是一个能在不同程度采集样本的表面,但器官之间不存在更高级的参数交流。除了可能的物理测量确定的那些低级协议而外,没有别的协议。
1704829242
1704829243
为了实现这个计划,每个小组都需要学会识别另一个小组模拟的模式。心脏不再能发送心跳的消息;它只能由肺通过诸如流体运动和组织位移等过程来推测。每个小组还需要学会建立另一个器官的模型,以帮助解释测量结果。这些模型也许不能作为独立、分离的结构而存在,但可能隐含在所选择的信号过程的方法中,而且几乎肯定能在运用中进行自我调节。
1704829244
1704829245
这种模型的建立大概可以叫做“统计表面联结”。假如它对器官模拟有用,对一般的计算机结构也可能有用。也许将来会有某种操作系统,其组成部分能相互识别、解释甚至预测。这样的系统不容易产生灾难性的崩溃。现在还无法知道这种计划能运行多好,不过,假如计算机要超过我们今天知道如何把握的尺寸,很可能需要采纳某些统计联结。
1704829246
1704829247
在目前的情况下,我们一贯把信息系统的描述(协议的遵守)看得非常乏味和低下,而且高傲地以纯理论的眼光来俯瞰复杂性。但是我们缺乏一个中间的视点——通过巨大组成部分之间的关系来形式地理解系统的复杂性。如果我们能以外科医生的观点将人体模拟为一张信息表面图,这样的技术有可能推广到认识生命系统的其他问题吗?
1704829248
1704829249
因为我们对信息结构的相对尺度没有直观的概念,所以计算机成果与自然结果的比较,走过了一段艰难的时间。专业和普及的出版物都在连篇宣扬人的计算能力很快就要赶上自然的复杂性了。例如,它们反复宣称计算机将最终认识人的情感和语言,计算机能在复杂的生命与我们只学会了编目的简单DNA序列之间搭起沟通的桥梁。
1704829250
1704829251
为了刻画我们在这个问题上的无知的本质,可以提出这样的问题:自然进化是一个笨拙、缓慢、低效的过程,还是某个像自然组装的超级计算机的结果?——在某些情况下,那个超级计算机甚至能在量子水平上运行,它能自我优化,从而在几乎最可能短的时间里产生具有不可约减的复杂性的结果。这两种情形是所有可能现实的两个极端。真实的情况我们还不知道,也许界于二者之间。我个人倾向于第二种:进化在完成不可约减的艰难使命时可能是非常高效的。103不过,大多数当代关于科学与技术未来的对话却似乎接受了另一个极端——再经过三、五十年摩尔定律的魔力,我们的计算机就超越自然了。
1704829252
1704829253
在线路和协议局限下的20世纪中叶的计算机科学支配着计算和生命系统的文化隐喻。例如,博尔赫斯(Jorge Luis Borges)描绘了一个幻想的图书馆,能囊括所有已经写了和将来可能写的图书。假如你有幸正好生活在一个能装得下它的宇宙(我们不是),那么你需要在星际飞船上耗尽无数代人的生命才能到达存放你需要的那本书的地方。104学会以传统方式来写好一本新书要简单得多。道金斯也想象过类似的无限的所有可能动物的图书馆。他想象那只看不见的盲目进化的手在轻轻抚过那个图书馆,为每一个生态小环境寻找最合适的动物。105在两种情形,作者都沾染了20世纪那不充分的计算机科学的隐喻。新的计算机科学尚未建立,不过我们至少可以猜想一下它可能的样子。
1704829254
1704829255
新的计算机和信息科学将包容一个遗留系统的理论。106复杂因果系统的空间构形太大了,不能理解为无限的图书馆,因为永远也不可能有足够的时间和精力来有效地浏览它们。例如,考夫曼喜欢宣扬我们的宇宙还不够老,不足以探索所有可能的(哪怕是非常小的)蛋白质。所以,复杂系统积聚着太多遗留的东西,限制了进一步的构形空间的找寻。我们必须学会丢掉我们能克服遗留的幻想。当老练的技术专家们提出给人类的新陈代谢或大脑结构添加基本元素的时候(确实有许多这样的建议),正是那些幻想在起作用。
1704829256
1704829257
还有一点值得我们思考的是:“遗留”和“语义”是不是一样的东西?“语义”描述的是以协议为基础的系统的语法壁垒特征以外的任何神秘事物。例如,人们总说自然语言系统是在发展中的,然而缺乏对语义的理解。遗留系统在信息系统中产生一个永恒不变的语言环境。遗留系统是复杂的。在减小系统的构形空间中,它们起着透镜的作用,增强了信息量的因势。
1704829258
1704829259
如果在大街上陌生人拦住你问有没有火柴,你说“有”,不会有什么麻烦;同样的话在婚礼上说后果就不同了——至少一般是这样。婚礼是祖宗留下的东西,积淀着不可能轻松抹去的历史。同样,DNA只有在胚胎环境下才可能有意义;我们前面说的思想实验中的聪明的异类,肯定不可能从一段孤立的DNA片段获得足够的信息来重新创造生命。
[
上一页 ]
[ :1.70482921e+09 ]
[
下一页 ]