打字猴:1.704611881e+09
1704611881
1704611882 不过香农所给出的对于熵和信息的理解,似乎既无法和传统的“信息”的概念相结合,也难以和玻尔兹曼对于“熵”的解释相融合。以电脑为例,我们可以轻易看出“信息”与“信息”之间的不同。无论你的电脑是台式电脑、笔记本电脑,还是智能手机,你都是使用这一设备去存储图片、文件和软件。我们将这些存储在电脑硬盘中的各类文档软件称为“信息”。然而,对于香农来说,如果我们能够任意点击硬盘中的存储数据,进而有效地销毁所有图片和文件,我们实际上增加了硬盘中的信息。听上去似乎是无稽之谈。这种增加其实是由于香农将“信息”定义为能够完整描述一个系统状态所需的比特数(以电脑为例,就是硬盘中包含了特定信息的一串比特序列)。因此,相比于表示具有规律性的图片和文件,香农提出,表示一串乱码时所需的比特数更多。虽然理论上来说这个结论是正确的,但是香农理论作为一个对于通信工程来说意义非常的研究结果,需要与通俗意义上的“信息”概念和玻尔兹曼的研究相结合。为此,我会从玻尔兹曼的研究入手,解释什么是“熵”,然后进一步尝试去完善地描述一个充满图片和文件的“信息丰富”的状态。
1704611883
1704611884 要懂得玻尔兹曼和香农之间对于“熵”的理解差异,假想一个只坐满一半的体育场。[4]注意,我们有无数种方式可以让一个体育场上座率达到一半,通过探索这些不同的方式,我们将解释什么是熵。
1704611885
1704611886 首先,假设人们可以在整个球场内自由移动。其中一种坐满半个球场的方式是让大家挨着中心场地落座,空出外围的半数座位;另一种则是坐在外围,空出中心区域的位子。当然,人们也可以随机选择自己的位子。
1704611887
1704611888 在解释“熵”之前,我还需要引入两个概念。其一,将每种坐满半个体育场的座位分布称为一种“状态”(或者更专业一些,称之为“微态”,即微观状态);其二,假设当两种状态的平均座位排号相同时,这两种状态可视为等价。
1704611889
1704611890 以体育馆为例,在统计物理学中,“熵”的定义即等价状态在所有可能的状态中所占的比率(严格意义上来说,其实是这个分数的对数,但对于我的论证并无大碍)。所以,熵值在人们全部坐在内圈或者外围时是最低的,因为人们只有一种坐法。8而当平均座位排号是最中间的座位排号时,熵值最大,因为存在无数种可能。玻尔兹曼把“熵”定义为某种条件下等价状态的个数,在这个例子中,最大熵值出现在当平均座位排号为中间排号时。
1704611891
1704611892 值得一提的是,即便人们通常将熵与混沌、无序相提并论,但实际上熵并不是用来衡量混乱程度的,而是衡量状态的多重性(等价状态的个数),只不过凑巧,无序状态往往多重性较高,因此实际中,高熵值的状态极有可能是无序的。所以,将熵值看作混乱状态的一种衡量方式并非毫无根据。然而,即使混乱程度并没有加深,熵值仍然可以增加,比如气体从一个体积为1的盒子中扩散到体积为2的盒子中(原先例子中的体育馆容量扩大到两倍)。此时,由于在更大的空间内气体的排列方式更多,熵值随着体积的增大而增大,但混乱程度却并没有随之提升。
1704611893
1704611894 比起实验性论证,香农更关心生活中通信系统的微态,比如一条推特或一座体育馆的座位,因此,香农使用“信息”来等价于熵值(因此,本书中它们基本是同义词)。想要准确描述一个平均座位排号居中的微态,需要更多比特,因为等价状态太多,所以我们需要更详细和具体的信息来精确定位到某个特定的微态上。所以,香农认为,信息和熵在功能上是等价的:想要具体描述一条特定消息(香农定义下的“信息”)的比特数,即代表了实际上能够传递出的消息数量(即熵,我们称之为状态的多重性)。但切记,信息和熵并不完全是一回事。正如1967年的诺贝尔化学奖得主曼弗雷德·艾根所说,“熵是(物理)状态的均值,而信息是一个特定的(物理)状态”。9
1704611895
1704611896 事实上,尽管我们要耗费更多比特来表达一个随机的混沌状态,但这并不意味着这些状态中蕴含更多的信息。越多的信息诚然需要更多的比特数,但这并不是事实的全部。以体育场为例,当人们随机挑选座位时,熵值最大但同时也最无序(即使等价状态中的其中一个可能是相当有序的)。事实上,在自然科学的研究领域中,或者大众的认知里,“信息”所代表的一向都不仅限于比特数,还包括对于有序程度的衡量。当遗传学家谈及DNA,或者一张乐谱,一部电影,一本书,在这些场合我们所提到的“信息”都暗指其中包含的秩序,而不单纯是表达一条基因链、书或者乐谱所需要的比特数。
1704611897
1704611898 但有序状态是罕见而特殊的。我会首先解释一下我为什么在这里用“罕见”一词;之后我将解释“信息丰富”状态的特殊性,这也关乎“信息”一词在现代口语中的含义。
1704611899
1704611900 为了解释有序状态的特殊性,我将会把玻尔兹曼关于原子的理论引入体育馆的例子中。现在体育馆中仍然只能坐一半的人,但条件是平均座位排号必须是最中间的座位排号。换成物理学,这就相当于要求系统的能量守恒。但即便如此,整个系统仍有许多状态可以使得平均座位排号居中,其中大多都相当随意,少部分则很特殊。如果将坐在体育场的人看作屏幕上的像素,则他们的座位排列可以拼成单词,比如“信息”,或是拼成图画,比如Hello Kitty的脸。但这些特殊的状态是否常见呢?
1704611901
1704611902 为了确定哪些状态是常见的,我们需要将所有可能的状态归类。方法之一就是寻找不同状态之间的关联性,如果其中一种状态可以简单地变化成为另一种状态,则它们相互关联。让我们简单地假设变形就是指所有人往上下左右相邻的位子上移动一格,使得形成的新的状态仍然满足平均座位排号居中的条件。也就是说,人们可以集体向右平移,或者坐在外围的人向内移一格,同时坐在内圈的人向外移一格。
1704611903
1704611904 原则上,简易的变形能够让我们转换到任意一种状态,但这操作起来却并不容易。如果体育馆中的人只能按照相邻法则选择位子(当然,要同时满足排号居中的条件),我们永远不可能突然间转换到一个拼凑成字母或图形的状态,因为这种状态极其少见并且难以达到。这个例子关乎信息是如何体现秩序的:在一个物理系统内,信息是熵的对立面,因为信息通常体现在罕见、规则但不容易得到的状态中。
1704611905
1704611906 比如布加迪威龙和吉他的构造就非常特殊,因此它们比那些用同样物质组成的常见结构包含了更多的信息,即便从理论上来说,如果无视有序结构中信息的关联性(否则我们对信息进行压缩,从而大大减少表达所需的比特数),表达同样组成部分构成的有序结构和无序结构,需要的比特数是相同的(对此,香农的理解十分正确)。由此,尽管香农和玻尔兹曼的理论不能相互融合,我们仍然可以得出“不仅仅是消息,绝大多数事物都由信息构成”这个结论。
1704611907
1704611908 让我们回到布加迪威龙的例子,不像推特,布加迪威龙是由极大量原子而并不仅仅是140个字符组成的,因此更为复杂一些。此外,正如我刚才所说,在这里我们并不是想要寻找所有可能的原子排列,而是寻找产生布加迪威龙的排列方式(就如同用座位拼出一个词一样)。例如,转动布加迪威龙的轮胎并不改变我们所感兴趣的一辆车的基本性质,所以任何轮胎转动方式不同的布加迪威龙都是等价的。完美的布加迪威龙很少,就像人们在体育场中的座位分布,原子的排列方式恰好形成一辆布加迪威龙的可能性很小。但另一方面,布加迪威龙的残骸,就具有很高的多重性(高熵值),同时包含更少的信息(即使表达这种混乱的状态需要更多的比特数)。不过所有状态中的绝大多数,都是“自然状态”下的布加迪威龙,如同人们随机地散坐在体育场里。在这种状态下,布加迪威龙中的铁以铁矿石,铝以铝土矿的形式呈现。布加迪威龙的损坏同时也是信息的损毁;布加迪威龙的生产,在另一方面,是信息的具象化。
1704611909
1704611910 以上的例子帮助我们理解了物质的形态是如何体现信息的,比如一辆布加迪威龙。体育场的例子还着重体现了秩序的动态起源:想要有任何形式的秩序出现,原子就必须找到正确的位置。但问题是,一个系统不能自由地在两种状态中随意切换,就如体育场的例子所表现的,一个系统的当前状态决定了这个状态进行改变的路径,并且对于一个系统来说,从无序到有序,需要的是连续性的变化。可惜,从无序到有序的路径比从有序到无序的路径少得多。对于一个任何改变都只是偶然的系统来说(如统计物理学中建立的一个系统),想要做一系列正确、连续的移动是不容易的。
1704611911
1704611912 比如一个魔方。你大可尝试一下,你是不可能通过偶然还原一个魔方的,因此它实际上完美地证明了还原路径和熵之间的关系。一个魔方有超过4.3×1019种可能的状态(即43 252 003 274 489 856 000),而只有一个是完美的有序状态,而且这个状态并不是那么难以达到,因为我们甚至可以在20步以内将它还原。10“20”这个数字听上去很小,但想要找到正确、连续的“20”步并不容易,大多数人在还原的时候都绕了弯路——还原魔方的经典套路(构建顶面的十字架,还原顶面四角,还原中间层等等),通常需要超过50步来完成(直到最近人们仍然认为还原魔方所需的必要步数大于20)。11但无论如何,这都说明,或多或少,只有极少可能的罕见还原路径通向一个完美的魔方;这些路径就隐藏在那些让魔方越来越混乱的海量路径之中。所以想要熵值增长,就去把魔方放在孩子的手中。因此,自然界中信息十分罕见,不仅是因为“信息丰富”的状态并不普遍,更是因为非人为条件下,这种状态很难达到。
1704611913
1704611914 那么“信息量丰富”的状态有什么特性呢?我们又如何利用这些特性去了解它们呢?这种状态的特征之一就是其中存在着长期或短期的内在联系,这在魔方中不难看出12:还原之后,魔方的相同颜色都尽可能地紧邻在一起。然而,这显而易见的关联性在自然中也有所体现,比如一条DNA链,其中包括一长串核苷酸序列(A、C、T和G)的序列。DNA链很长,先进的科学技术仍然无法揭示大多数的DNA序列的意义,但只要和一串随机的核苷酸序列进行比较(就像扔一个四面的骰子),我们还是可以知道DNA链中哪一部分包含大量信息。通过比较,我们能够识别那些罕见的核苷酸序列——那些即便是随机组合也很少出现的序列,其中相邻的核苷酸之间有着特殊的关联性(就如同座位分布恰好拼出了一个词),甚至距离甚远的核苷酸之间也具有关联性(现在座位组成了“段落和章节”,并且首尾呼应,对之前的词做出了进一步的解释)。正是这些关联性体现了存储在DNA链中的信息,同时也表明DNA序列并非是随机生成的,而是在进化过程中被发现、保存、打磨,并不断演化而来的。13DNA的大量未知编码说明,即使我们无法解读,信息仍然存在。DNA排列方式并不是想要重新定义“信息”。尽管我们很难了解DNA序列的意义或功能,但我们仍能够检测到DNA中信息的存在。因此,我们不应该混淆信息本身的存在与其含义,或从旁观者的角度寻找信息。人类语言所交流的信息(如英语)以及生物交流所传递的信息(如DNA)之间的关联性在于我们是否知道如何翻译它们。它们代表着这个时代信息资源丰富的特点,不随观察者的改变而改变。这表明,对于“沟通交流”来说,我们需要一个从无意义到有意义的转化:我们向外传递的有意义的信息,是建立在信息本身毫无意义的物理秩序之上的,而这些无意义的物理秩序就是真正的信息本身。[5]
1704611915
1704611916 最后,我们把熵的多态性与我们处理信息的能力(分析计算能力)相联系。正如我们在魔方的例子中所看到的,我们很难找到“信息丰富”这样一种状态,这不仅是因为这种状态很罕见,也是因为我们找不到达到这种状态的途径。这也就是为什么我们把一些人成功复原魔方的能力归结于他们的高智商:那些成功复原魔方的人找到了那些罕见的途径(或是找到了发现这些途径的规则)。其实,我们还可以用比魔方更简单的例子去阐释一个系统的多态性和计算之间的关系,考虑这么一个游戏:婴儿把不同形状的物体,比如圆柱体、正方体,插进形状相吻合的缺口里。大部分婴儿在14个月大的时候可以很顺利地将球体或圆柱体放进相对应的洞中,但当遇到立方体、正方体、三角形和其他形状时却不知所措。14为什么?把一个圆形的球对准放到洞里很容易,因为无论你怎么旋转它都看起来一样(所有状态都相同);把一个圆柱体放进洞中也很容易,因为如果沿着它的轴线旋转它的状态也不发生改变。然而,把一个立方体放进相对应的洞内会相对来说难一些,因为只有少数几种旋转方法可以使它的状态和缺口刚好相对应。三角形会更加复杂,因为与缺口相对应的旋转状态更少。对于婴儿来讲,把不等边三角形(只有一种旋转方法才能把它放进洞内)放入洞中的难度相当于让成年人复原魔方,只有极少数的婴儿能够做到。由此可见,当婴儿逐渐能够将不同形状的物体放入其对应的缺口中时,他们也在慢慢发现那些十分罕见的低熵值的稳定状态。婴儿把不同形状的物体放进相对应的缺口中,或是青少年复原魔方,这些能够在每种状态都具有可能性的连续变换中发现罕见但是有用的状态的能力,是我们处理信息能力或者计算的一个很好的简化模式。
1704611917
1704611918 ***
1704611919
1704611920 在本章的开头,我们通过破坏一辆假想中的布加迪威龙说明了产品所体现的就是物理秩序,或者说信息。然而,我们还没有解释这个秩序源于什么地方,为什么它会增长, 以及它为什么有经济价值。在下一章中,我们将从最基本的角度探寻物理秩序的源头,并在接下来的几章中探究人类在经济社会中积累着怎样的物理秩序,为什么这些秩序是有用的,以及人类如何促进秩序的增长。当我们从信息角度对产品进行阐述之后,我们将会探究那些限制我们生产秩序(比如在布加迪威龙上得以体现的信息)的社会和经济机制。这将帮助我们了解世界经济不均衡发展的过程,同时让我们从信息的增长映射到社会和经济的发展。
1704611921
1704611922 [3]1磅=0.453 6公斤。——编者注
1704611923
1704611924 [4]喜欢钻数学牛角尖的人所构想的体育场应该是这样的,当我们逐渐远离运动场地时,每一排的座位数保持不变,而座位所在的排数大小是随着该排座位距场地的远近而变的。
1704611925
1704611926 [5]当然,一幅具有绝对相关性的图像,如颜色一致的一幅画(如一个巨大的红色方形),它所包含的信息量是很少的,这正是因为它们之间的相关性太高了,以至于我们只要知道一个像素就能推知其他所有。这个例子告诉我们,信息并不存在于绝对有序或是绝对无序的结构中,信息是在不规则碎片状、不规则但又有一点点秩序的结构中,在这样的结构中的不同位置各有相关性,比如像是一张脸、一棵树、一台汽车引擎甚至是一朵云都有着这样的结构。
1704611927
1704611928
1704611929
1704611930
[ 上一页 ]  [ :1.704611881e+09 ]  [ 下一页 ]