1700931800
假定你每次只把字母少许混乱一下。句子会逐渐丢失它的连贯性。“克努特国王有个疣下颌上”依然是可识别的。“克努特国王个有疣颌下上”同样也是。然而字母会逐渐变成一堆混乱的、没有意义的字母。有如此多的无意义的组合,以至于通向乱语的趋势是不可避免的。
1700931801
1700931802
现在我可以给出熵的定义了。熵是排列数目的测度,遵从某种特定的、可识别的判据。如果判据是存在65比特,那么排列的数目是265个。
1700931803
1700931804
不过在265比特的情况下,熵不是排列数,它恰好是65,也就是你将2相乘得到排列数的次数。数字2必须相乘起来得到给定数的数学术语称为它的对数。[65]于是,65是265的对数。因此,熵是排列数的对数。
1700931805
1700931806
在265种可能性当中,实际上只有一小部分有意义的句子。我们猜想有10亿个,为了得到10亿这个数,你必须将大约30个因子2相乘在一起。换句话说,10亿大约是230,或者等价地说,30是10亿的对数。因此得出结论,有意义的句子的熵大约只是30,远小于65。无意义的符号的混乱排列,比表述连贯句子的熵大得多。当你弄乱字母时,熵增加,这实在没有什么奇怪的。
1700931807
1700931808
假设宝马公司极度地提高了质量控制,从生产线上生产的汽车彼此完全相同。换句话说,假设有且只有一种原子排列才被认为是真正的宝马,那么它的熵是多少呢?答案是零。当宝马从生产线出来时,任何细节都已经确定。不论何时你确定了一种排列,就完全没有了熵。
1700931809
1700931810
热力学第二定律规定熵增加,它仅是以一种方式说明:随着时间的增长,我们趋向于失去细节。想象我们将一小滴墨汁放到一壶热水中。一开始,我们精确地知道墨汁的位置在哪里。墨汁的可能组态数目不是太大。但当我们看到墨汁扩散到水中时,关于单个墨汁分子的位置,我们开始知道得越来越少。我们所看到的是一个均匀的、浅灰色的一壶水,相应的排列数目已经变得非常大。我们可以耐心地等待,然而我们不会看到墨汁分子重新集聚到一起形成一滴墨汁。熵增加了,这就是热力学第二定律,事物趋向于令人乏味的均匀性。
1700931811
1700931812
这里还有另外一个例子,一个装满热水的浴缸。我们对缸中的水,了解了多少呢?假定它停在浴缸中的时间足够长,没有可观测的运动。我们可以测量缸中水的量(50加仑),也可以测量它的温度(40℃)。但是缸中充满了水分子,对于给定的条件,也就是50加仑(1加仑约4.55升)40℃的水,相对应的水分子的排列方式显然有很多。如果我们可以精确地测量每个原子,那么将可以知道得更多。
1700931813
1700931814
熵是不可观测的细节中所隐藏的信息的量度。因此,熵是隐藏着的信息。在大多数情形下,信息是隐藏的,因为它所涉及的东西太小而无法观测到,太多而无法跟踪。在洗澡水的情形中,细节便是浴缸中千千万万个水分子的位置和运动。
1700931815
1700931816
1700931817
1700931818
1700931819
晶格
1700931820
1700931821
如果将水温降低,直至绝对零度,那么熵发生了什么变化呢?如果我们移去每一点能量,那么水分子会自动以一种独特的组合来排列,冰冻的格子将形成一个理想的冰晶体。如果你熟悉晶体的性质,即使分子太小而无法观测,那么你也可以预测每个分子的位置。一个理想的晶体就如同理想的宝马车一样,没有丝毫的熵。
1700931822
1700931823
你可以在图书馆中填塞多少个比特呢
1700931824
1700931825
使用语言的模棱两可,以及微小的差异常常被高度重视。事实上,如果语言极为精确,可以被编程为计算机,那么语言和文学必将处于一种尴尬状态,然而科学的精确性要求高度的语言精确度。信息这个词可以指更多的东西:“我认为你的信息是错误的。”“根据你的信息,火星有2颗卫星。”“我获得了信息科学的硕士学位。”“你可以在国会图书馆找到信息。”在这些句子当中,信息以某种特定的方式被使用着。只有在最后一个句子中,信息这个词的意义,才可用作下述发问:“信息在哪里呢?”
1700931826
1700931827
我们来追寻定位这个概念。如果我告诉你,格兰特埋在格兰特墓中,[66]大家都会毫不怀疑地认同我,给了你一条信息。但信息在哪里呢?它在你的头脑中吗?在我的头脑中吗?有确定的位置是不是过于抽象呢?它是分布在整个宇宙间,供我们每一个人使用吗?
1700931828
1700931829
这里有一个非常具体的回答:信息在记录上,以碳和其他分子组成物质的文字形式存储。在这个意义上,信息是一种实在的东西,几乎如同物质一样。它是如此的具体,以至于我书中的信息和你书中的信息是不同的。在你的书中,写的是格兰特葬在格兰特纪念堂里。你可能猜测到我的书中,与你所说的是同一件事情,但你并不是确切地知道这一点。我的书中或许会写道:格兰特埋在吉萨金字塔中。[67]事实上,任何一本书都不包括信息。格兰特被埋在格兰特纪念堂中的信息在格兰特纪念堂里。
1700931830
1700931831
就物理学家所使用的词语的意义来说,信息是由物质[68]组成的,它无处不在。本书中的信息在一个长方体中,大约是10英寸乘以6英寸乘以1英寸,也就是10×6×1或者60立方英寸。[69]本书的封面中隐藏有多少比特的信息呢?在每一行中,大约有70个字符的空间,字母、标点符号、标记和空格。每页有37行,共有350页,大约是100万个字符。
1700931832
1700931833
我的计算机键盘上大约有100个符号,包括大写字母、小写字母和标点符号。这意味着本书中所包含的不同信息的数目大约是100自身相乘100万次,也就是100的100万次方。这个数是非常大的,它大约等于将2相乘700万次。本书中包含了700万比特的信息。换句话说,如果用莫尔斯电码来写本书,那么大约需要700万个点和短划。将它除以本书的体积,可得到每立方英寸大约有120 000比特的信息,这就是印刷记录本卷的信息密度。
1700931834
1700931835
我曾经从一本书上读到,亚历山大图书馆在它被埋入地下之前,包含万亿比特的信息。虽然这个图书馆不是官方的世界七大奇迹之一,但是它依然属于最伟大的古代奇迹之一。[70]它建于托勒密二世期间,据说通过50万册羊皮卷的形式包括了所有已写的重要文件的复本。没有人知道谁把它烧毁了,但可以确信的是,许多无价的信息灰飞湮灭了。总共是多少信息呢?我猜测古代的一卷羊皮卷大约等于50张现代纸张。如果这些纸张与你所阅读的东西相仿,那么一个羊皮卷将有100万比特,乘以数十万卷。以此推算,托勒密的图书馆包含有半个万亿(1万亿=1012)比特的信息,与我在书中看到的极为相近。
1700931836
1700931837
这些信息的丢失是最大的不幸之一,古代学者不能在今天复生。但有件事更不幸,如果包括旮旮旯旯在内的每一个可允许的立方英寸都充满了像本书这样的书。我不知道这个巨大图书馆的精确大小,不过我们假设它为200英尺×100英尺×40英尺,或者是800 000立方英尺,这和现在的大尺寸的公共建筑的大小相同,这将是14亿立方英寸。[71]具备了这些知识,我们就容易估计出可以在这个楼房中填塞多少比特。如果每立方英寸含120 000比特,那么总数是1.7×1014比特。多么巨大的信息量啊!
1700931838
1700931839
1700931840
1700931841
1700931842
为何到了书本就打住了呢?如果每本书都缩小到它们自身体积的1/10,那么可以塞进10倍之多的信息。如将信息转移到微缩胶片,则可以允许更多的信息。
1700931843
1700931844
包含单个比特所需要的空间大小,存在基本的物理限制吗?数据的一个真实的比特的物理尺寸比原子、原子核和夸克大吗?我们可以不停地分裂空间,并将它装满无穷多的信息吗?或者说存在一个极限吗?这个极限不是来自于实际技术的限制,而是自然界深层次定律所要求的限制。
1700931845
1700931846
最小的比特
1700931847
1700931848
单个比特比原子小,比夸克小,甚至比中微子还要小,它可能就是宇宙中最基本的构成砖块。比特没有任何结构,它或者就在那里,或者不在那里。约翰·惠勒认为所有的物体都是由比特信息组成的,他用一句格言来表达这个观点:“大千来自比特。”
1700931849
[
上一页 ]
[ :1.7009318e+09 ]
[
下一页 ]