1701557203
1701557204
信息理论并没有告诉我们可以使用多少信息来描述事物,它只告诉了我们所需要的最小数量的信息——还记得吗?香农曾经试图在铜线中填充最大量的通话数量,以此最大限度地提高通话能力,并尽量减少新基础设施投资(电线杆、电线、网络交换机)。
1701557205
1701557206
电脑专家花了大量时间研究压缩信息,以便让他们的计算机系统能够更顺畅地运行。另一个了解香农信息理论的方法是看看以下两个64字符长的字母字符串:
1701557207
1701557208
1.abababababababababababababababababababababababababababababababab
1701557209
1701557210
2.qicnlnwmpzoimbpimiqznvposmsoetycqvnzrxnobseicndhrigaldJguuwknhid
1701557211
1701557212
我们可以用2位运算指令将第一个字符串表示为:
1701557213
1701557214
64个字母,ab交替
1701557215
1701557216
第二个字符串是一串随机序列,需要64条单独指令(6比特),因为指令本身必须跟字符串完全一致:
1701557217
1701557218
qicnlnwmpzoimbpimiqznvposmsoetycqvnzrxnobseicndhrigaldJguuwknhid
1701557219
1701557220
那么,我们如何确定某个数字序列或字母是否是随机的?俄罗斯数学家安德烈·科尔莫戈罗夫对此提出了一个具有影响力的想法。他认为,一个字符串如果没有办法来描述它,或没有代表它的缩写形式,那么它就是随机的。顾名思义,上述序列1不是随机的,因为我们可以找到一个方案(计算机科学家称为一个算法)来简单地表示它;序列2是随机的,因为除了按照它们的实际顺序一个一个单独列出来之外,我们找不到其他方案。
1701557221
1701557222
科尔莫戈罗夫复杂性理论对此是这样概括的:当你无法用比原序列更少的元素来描述它的时候,它就是随机的。在这里,复杂的定义与我们日常生活相吻合,这也为这一术语的使用奠定了基础。我们说一辆汽车比一辆自行车更复杂,因为制造一辆汽车确实比制造一辆自行车需要更多的指令。
1701557223
1701557224
信息理论可以应用于组织系统,例如计算机技术文件和文件夹层次结构以及公司中的组织结构图。根据科尔戈罗夫复杂性理论,如果组织结构图可以由少量简单的规则进行描述,该公司可以被视为高度结构化的。比较以下这两种描述:对公司1而言,顶部是首席执行官,他负责监督3个人;这种方式扩展下来,到达第四个层次;在这之后每人监督50~100人。这种模式可能适用于话费、水费、电费或燃气公司。这些公司都拥有四层管理,还有一些工人在现场修理,或安装线路,或阅读器械表。这也可能是一家技术公司,客服与技术援助人员处在最底层。只需2比特,我们就可以完全准确地描述这一组织结构图。
1701557225
1701557226
1701557227
1701557228
1701557229
图7–5 高度结构化组织结构图
1701557230
1701557231
当我们描述一个系统及日常结构欠佳的公司时,需要用到更多的元素,因为我们根本找不到一个可识别的模式,就像上面的随机字母序列2一样:
1701557232
1701557233
一个系统越结构化,描述它所需的信息就较少;相反,混乱或非结构化系统则需要更多的信息来描述。在极端情况下,最混乱的系统可能每个元素都是无序排列的,因为随机系统中没有任何模式而言,每一个元素都需要被单独描述。这就需要大量的沟通,或者用香农的话说,这需要大量信息。这是大脑难以解决的问题的反直觉表达。我们从小就知道信息越多越好。当你需要做出艰难的医学决策时,你从医生和研究报告中获取的信息越多,你就越有可能做出最明智的决定。但是,这一切都是连贯的。如果某种医学状态很好理解,很多文献也已经进行了大量描述,我们就不需要太多的信息来告诉自己应该怎么治疗。“如果你有肺炎球菌,请服用抗生素。”这很容易。但是,癌症、多发性硬化和狼疮都很少被人理解:有太多的可能性,有太多异常和不同的因素需要平衡;因此,我们需要更多的信息来理解它们。
1701557234
1701557235
1701557236
1701557237
1701557238
图7–6 混乱或非结构化系统示例图
1701557239
1701557240
信息理论的力量在于它可以用于任何事物——网站构建、法律道德领域,甚至是你给要找到你家的人的指引。我们再来想想之前所提到的网站和电脑文件层次中的横向结构与纵向结构。香农信息理论可以用于量化结构层次,也可以用于量化其中包含的信息(这里,我们所讲的信息指的是层次结构本身包含的信息,与网站内容包含的信息不一样)。
1701557241
1701557242
或者,我们也可以看看法律系统。法律文件都包含有大量冗长的话、大量例外、大量特定,因为它需要包括所有可能的情况。例如,几乎所有文明社会都对强奸、谋杀、抢劫、敲诈勒索、残害、袭击、殴打和诽谤制定了相关规则。这些守则编码在书籍和电脑上时占用了大量空间。从信息理论的角度来看,这些都可以用一个简短的算法将其最小化:不要对别人做他不愿意接受的事情(这基本上是黄金法则)。
1701557243
1701557244
同样,让我们看看你的朋友给你的两个版本的指引:
1701557245
1701557246
1.沿着高速公路40东向高速公路158东走,主街左转,罗勒大道右转,南湖路左转,沿着北湖路直行,主街右转(与之前的主街不同),快速向左上大瀑布路,第八个路口右转,直到到达右边的66号,我家就在公园前面。
1701557247
1701557248
2.沿着高速公路40东直行,按照指引到达大瀑布地区公园——我家就在入口处。
1701557249
1701557250
版本2具有更少的科尔莫戈罗夫复杂性。我们注意到,版本2运用了第2章中我们所提到的一个原理:尽可能地将信息延伸至外部世界——这里指的是已经存在的路标。
1701557251
1701557252
给定一个组织结构图,我们就能够计算出其中包含的信息,测量出该组织的复杂性;或者利用这些数据,我们可以计算出公司、军事组织或任何其他工作或社会单位的结构(或组织)程度。这里,当复杂度较低时,结构度则较高——也就相当于香农信息内容较少。这仿佛又跟我们的直觉相悖,但如果一个组织的结构图能够用很少的话语、简单的规则进行描述,这个组织就拥有较高的结构程度。这一点无一例外。
[
上一页 ]
[ :1.701557203e+09 ]
[
下一页 ]