打字猴:1.704829198e+09
1704829198 未来50年 [:1704828079]
1704829199 复杂性的顶点
1704829200
1704829201 J·拉尼尔
1704829202
1704829203 计算技术流行的第一个50年,大体上跨越了20世纪的后一半。这是忘形的夸张与沮丧的失落疯狂交替的50年。夸张来自计算机的创立者们:图灵想知道,机器,特别是他那抽象的“万能机器”,能否最终成为在精神上与人同等的东西;香农(Claude Shannon)以同样的激情把“信息”定义为具有最广大的范围、囊括了一切热力学过程的东西。
1704829204
1704829205 我们同样可以说,因为所有生命都是化学相互作用构成的,所以任何化学仪器都可以作为人的某种原生的形式。我们没有那样说,因为生命物质的化学复杂性与可以在当代化学实验室里研究的复杂性之间存在着显然的差别。我们可以直观感觉这种差别。反过来,我们却不能直觉地分辨不同信息系统之间的复杂性的差别。一个说自己在研究“人工智能”的严肃的知识群体,早在20世纪50年代的时候,就相信计算机很快能流利地说自然的语言。当然,这在今天还没有发生,而且我们仍然感觉不出理解自然语言到底是多大的问题,需要多长的时间才能解决。
1704829206
1704829207 夸张还在继续着。在计算机科学部门里,甚至总能找到那样的一群精英,他们相信在未来的50年必然会出现一个“奇点”。奇点出现的时候,计算机已经聪明绝顶、威力无穷了,它不但取代了作为占统治地位的生命形式的人,还主宰了物质和能量。它像神或上帝那样存在,完全超越了人的概念。上面这些句子,我写起来都觉得奇怪,却是我的许多同事的想法的真实写照。
1704829208
1704829209 有些读者会注意到我因为同样夸大了“虚拟现实”而受到了批评。98不过常常被误会的是,虚拟现实的目标不是彻底描述或再现物理现实(那几乎是不可能的妄想),而是充分理解人类的认知,把人的神经系统投入到幻想的进化游戏。虚拟现实在本质上是关于舞台魔术的极限的研究,而不是关于约化物理现实的研究。
1704829210
1704829211 当人们在理论上堂吉诃德式地夸耀计算机的力量时,真实的信息系统的表现却一个接着一个地令人惭愧和失望。计算机是惟一注定会在正常运行中经常发生意外事故的工业产品。维护信息系统的费用几乎总是被低估了,甚至可以说这是现代商务的惯例。
1704829212
1704829213 具体说来,正是软件这个东西,我们不可能照预计的价格来控制它,不过那只是一定类型的软件。硬件会以摩尔定律的指数形式变得更小、更快、更便宜。正是这么飞速的进步点燃了狂热夸张的激情。封闭系统的软件,有着小巧而且可以固定下来的不变的界面,也能做得很可靠,但不会很便宜。这类软件的一个例子是驱动现代飞机(如空中客车)的密码。那类我们似乎还不能控制的软件,有着复杂而且随周围环境改变的界面。例子是个人计算机软件,都知道那是很难控制的。重要的是不要混淆这两类软件。20世纪末广泛流行着一种奇怪的妄想,说千年虫(Y2K bugs)会产生大规模的破坏。破坏没有发生,原因是多数基础软件都是可以控制的,虽然代价很高。
1704829214
1704829215 未来50年里,计算机科学中的这两种趋势——能力的夸大和代价的低估——可能还会继续下去。这种景象大概可以叫“帮助台的行星”,生在其中的人们将费巨大的力气来维护十分庞大的软件系统。99这个景象倒不是一点儿吸引力也没有,因为它能让人的力量得到充分的发挥。暗淡的未来是逃避不了的,不过我们还是值得想象一个可能带来崭新东西的计算机科学的新时期。
1704829216
1704829217 首先,计算机科学必须回到起点,重新考虑信息与物理过程的关系。香农破天荒地将可以测度的信息量与物理系统的熵联系起来,但这个孤立的公式容易使人误解。实际上,并不是所有信息量都能测度,因而有些信息会比其他信息更重要。物理系统中多数有可能被测度的信息量实际上都在统计分布的海洋中丢失了。20世纪后期有个流行的比喻说,蝴蝶轻轻抖动一下翅膀,几个星期以后也许能在地球的另一端引发大风暴。与这种观念相关的一个问题是,即使它偶尔是对的,也没有那么多风暴来回应那么多的蝴蝶。100我们也许可以说可测的信息有着不同的“因势”101。香农的信息大概应该重新命名为“势信息”。如果一个信息单元很重要——就是说,它有很高的因势——就一定要研究它;它必然是系统的关键部分。这产生了有时被称作“语义学”的东西,也就是计算能在其中显出意义的那个环境。
1704829218
1704829219 在计算机科学里也总是存在一个观测者的问题(只是偶尔被承认)。为了表述这个问题,一种办法是考虑某个对人类语言、历史和文化一无所知的异类生命。那些异类不可能漂浮在星际空间编一本莎士比亚戏剧,同样也不可能可靠地重构一台孤立的个人电脑的意义和功能。
1704829220
1704829221 这不是遥远的理论问题,而是急迫的实际问题。由于当前人类工程师具体分析和控制软件的能力限制了软件的复杂性,可以说,我们已经达到了我们所知软件的复杂性的顶点。如果不寻求新的软件思想和设计途径,那么,不论处理器变得有多快、多丰富、多奇特,我们也写不出超过千万行代码的程序。
1704829222
1704829223 在20世纪中叶计算机科学的黎明,我们惟一的直观感觉的信息经验是通过线路来发送脉冲。早期形式的信息论——在标准课程里至今仍然占着统治地位——关心的是线路末端世界的一个个采样点。于是,如我们所知,计算机的结构设计就围绕着这些模拟线路。源代码是对脉冲的模拟,它可以像传递的变量或者消息那样连续地向线路发送出去。
1704829224
1704829225 为了让一根线上的脉冲有意义,需要一个协议来根据信号的顺序为它赋予某种意义。计算机科学的前半个世纪几乎就是在这样的协议激发下走过的。当然有成功的,如开通互联网的协议。但这不是自然系统的工作方式。虽然在理论上我们可以用20世纪的算术协议来解释视觉皮层从光学神经接收到信号以后的行为,但这种做法会在我们完全不可能把握的尺度上涉及巨大的复杂性。显然,协议的遵守并不能有效解释同时接收大量输入信号的系统,而且可能也不足以设计庞大的系统。如果我们以一个能在多点取样的面来替代线的概念,那么我们必须脱离算术协议而走进一套新的技术,包括模式的分类、绝对确定的预测模型的自动维护。
1704829226
1704829227 当前的一个实际问题可以说明这一点:我多年来和外科医生一起做模拟模型,以帮助他们为特定的病人制定医疗方案。以今天的标准看,模型很复杂。为了保证它们有用,每一个模型都由有多年经验的专家群体建立和维护,而且都必须经过几千个病人的检验。
1704829228
1704829229 现在,假定某医学院的一个小组用10年的时间做出了绝妙的虚拟心脏,显示了良好的手术应用前景。同时,在另一个学院,一个类似的小组用10年时间研究了虚拟肺。我们假定,两个小组愿意把他们的成果结合在一个虚拟的胸腔里。
1704829230
1704829231 两个小组几乎肯定会运用互不相容的协议。他们不但可能选择不同的基本机器、操作系统、执行语言等,还可能走不同的概念路线。也许一个小组强调维护整体的、自上而下的约束,而另一个小组喜欢自下而上的组织法则。一个小组可能强调对象的语义学,另一个小组则试图逼近一个连续的系统。在当前的技术水平下,两个小组可以就能在它们之间传达的线路信号达成一个协议。这样的协议是有问题的;在这种情形,复杂性也许只能起着某种抑制作用。几年后我们会明白的,目前正在努力。如果可能有器官之间的协议,那么达成一个协议就等于被迫在器官模拟技术上做一次可悲的交易。一个工作协议几乎肯定会损害我们改进任何相关组成器官模拟的前景。
1704829232
1704829233 为了理解为什么会这样,我们需要深入信息系统遗留的问题。最能刻画我们时下软件的形容词是“脆弱”,崩溃了也不会屈服。这是过分遵守协议的结果,那原本是一个不可原谅的要求。因为这些根本的脆弱性,软件是一层层搭建起来的,为了发掘那些已经为众多用户以不同方式所依赖的协议,还不知道有多复杂,需要花多少钱。于是我们有了“锁定”现象:有些软件实际上成了强制性的。锁定现象被20世纪末的软件销售者们操纵着,为他们带来了有史以来最大的财富。
1704829234
1704829235 除了锁定,软件还有更令人讨厌的特征,我称它为“沉淀”。在软件沉淀的过程中,协议连同嵌在协议里的思想都成了强制性的。文件的思想就是一个例子。大约1984年前,人们还在争论文件是不是好办法。有些计算机科学家觉得共享的信息最好能有细粒化的结构——也就是一个由字母似的基本小单元构成的单独的整体文件。实际上,第一代国际版的Macintosh计算机并没有使用文件。102可是,发行版的Macintosh有了文件,而且Windows、Unix和其他几种广泛应用的系统也都有了文件。现在我们将文件作为像光子一样基本的严峻现实告诉学生,尽管它们是人类发明的。
1704829236
1704829237 回头来看虚拟的心和肺。一旦两个工程小组达成了协议,那协议就成为他们的主人,因为他们不得不同时改变自己来修正它;那是一个复杂而昂贵的任务,实际上是不可能的。不论协议达成的时候流行什么样的关于器官联络的思想,它都会“沉淀”下来。思想也就停止了。
1704829238
1704829239 因此,未来50年计算机科学的一个美好愿望是为大系统的组成寻求一种新的联络方法,以取代对协议的依赖。在心和肺的情形,那种方法已经隐约显露出来了。
1704829240
1704829241 我们设想,每个器官都认为另一个是真实的血肉器官,连接着一个真实的传感器。每个器官可以测量另一个器官里的基本性质,如温度、压力和在时间和空间的某个点的化学组成。每个器官在另一个器官看来都是一个能在不同程度采集样本的表面,但器官之间不存在更高级的参数交流。除了可能的物理测量确定的那些低级协议而外,没有别的协议。
1704829242
1704829243 为了实现这个计划,每个小组都需要学会识别另一个小组模拟的模式。心脏不再能发送心跳的消息;它只能由肺通过诸如流体运动和组织位移等过程来推测。每个小组还需要学会建立另一个器官的模型,以帮助解释测量结果。这些模型也许不能作为独立、分离的结构而存在,但可能隐含在所选择的信号过程的方法中,而且几乎肯定能在运用中进行自我调节。
1704829244
1704829245 这种模型的建立大概可以叫做“统计表面联结”。假如它对器官模拟有用,对一般的计算机结构也可能有用。也许将来会有某种操作系统,其组成部分能相互识别、解释甚至预测。这样的系统不容易产生灾难性的崩溃。现在还无法知道这种计划能运行多好,不过,假如计算机要超过我们今天知道如何把握的尺寸,很可能需要采纳某些统计联结。
1704829246
1704829247 在目前的情况下,我们一贯把信息系统的描述(协议的遵守)看得非常乏味和低下,而且高傲地以纯理论的眼光来俯瞰复杂性。但是我们缺乏一个中间的视点——通过巨大组成部分之间的关系来形式地理解系统的复杂性。如果我们能以外科医生的观点将人体模拟为一张信息表面图,这样的技术有可能推广到认识生命系统的其他问题吗?
[ 上一页 ]  [ :1.704829198e+09 ]  [ 下一页 ]