1700495425
算法之美:指导工作与生活的算法 归档与堆存
1700495426
1700495427
在决定好哪些东西应该保留以及该储存到哪里之后,最后一个问题就是了解如何对其加以管理。我们已经讨论过哪些东西应该装进壁橱以及壁橱应该放在什么地方这两个问题,但是壁橱里面的物品应该怎么安排呢?
1700495428
1700495429
迄今为止,我们见过的所有家居管理建议中,必不可少的一个“常客”就是“物以类聚”这个存放概念。也许没有人会像野口由纪夫那样直言不讳地反对这条建议。他说:“我必须强调,在我的方法中,一个基本原则就是不能把文件根据内容分组。”野口是东京大学的一名经济学家,他通过一系列著作介绍了可以把你的办公室和你的生活变得井井有条的“超级”技巧。这些书的标题可以大致翻译为“超级说服方法”,“超级工作方法”,“超级学习方法”以及与本书最贴近的“超级组织管理方法”。
1700495430
1700495431
在他作为一名经济学家的早期职业生涯中,野口发现自己经常被包括通信、数据、手稿在内的各种信息淹没,他每天都需要花费大量时间来管理这些东西。因此,他决定换一种管理方法。他首先为每个文件准备一个文件夹,然后在文件夹封面上标注文件名称和日期,再将装好文件的文件夹全部放到一个大盒子里。这个做法不仅可以节省时间(因为他不必考虑每个文件应该放到哪个位置的问题),而且不需要建立任何组织形式。后来,在20世纪90年代初,他又取得了一个突破:把那些文件夹一个一个地插在盒子的左侧位置。“超级”文件归档系统就这样诞生了。
1700495432
1700495433
野口明确指出,无论旧文件还是新文件,都必须遵循左侧插入规则。每次取出一个文件,在使用后放回时都必须把它插到盒子里最左边的那个位置。寻找文件时,也总是要从最左侧开始查找。因此,最近使用过的文件很快就能找到。
1700495434
1700495435
野口解释道,因为把每一个用过的文件放到左边,比在原来的地方重新插入文件要简单得多,所以久而久之,就形成了这种习惯。后来他才逐渐意识到这个方法不仅简单,而且效率惊人。
1700495436
1700495437
将使用过的文件夹放回去时,采用野口的文件归档系统显然可以节省时间。然而,我仍然需要先回答这样一个问题:这种方法是否方便你找到所需要的文件夹?毕竟,这个方法明显是与其他效率大师唱反调,因为那些大师告诉我们,应该把类似的事情放在一起。事实上,即使从词源学这个角度看,“有组织”(organized)这个词也会让人联想到身体是由一个个器官(organ)组成的。如果细胞没有“物以类聚”,也就是说形状和功能相似的细胞没有组合在一起,器官就不复存在。
1700495438
1700495439
但是,计算机科学可以保证它的方法有效,而这是大多数效率专家做不到的。
1700495440
1700495441
野口当时并不知道,他的这个文件归档系统其实是最近最少使用原则的一种延伸。最近最少使用法告诉我们,当我们在缓存中添加一些内容时,我们应该丢弃保存时间最久的内容,但是它没有告诉我们应该把新的内容放在哪里。这个问题的答案来自20世纪七八十年代计算机科学家进行的一系列研究。不过,计算机科学家研究的是一个名称为“自组织列表”的不同版本,但是它的设定与野口的文件管理困境几乎一模一样。假设一组物品按序排列,你需要定期从中搜索一个物品,而且必须采用线性搜索方法,也就是说,你必须从头开始,逐项搜索。但是,一旦你找到了所搜索的物品,就可以把它放回序列中的任何位置。要使搜索的效率最高,将物品放回时该如何选择位置?
1700495442
1700495443
1985年,丹尼尔·斯雷特和罗伯特·陶尔扬发表了一篇关于自组织列表的权威论文。他们按照计算机科学的经典方式,对所有不同请求顺序下各种列表组织方式的最坏表现进行了研究。根据直觉,由于搜索是从前面开始的,所以你在排列顺序时肯定希望把最可能被搜索的项排在前面。但是,到底是哪些项呢?这个问题再次唤起了我们对未卜先知能力的憧憬。在普林斯顿和硅谷都有职务的陶尔扬说:“如果你提前知道各种请求的先后顺序,就可以有针对性地制定数据结构,把完成整个序列的总时间降到最低。这就是最优离线算法。你也可以称之为上帝的算法,或者天上的算法。当然,没有人知道未来,所以问题是,如果你不知道未来,你能企及这个超凡脱俗的最优算法吗?”斯雷特和陶尔扬的研究结果表明,一些“非常简单的自我调整计划竟然全部遵循千里眼算法的一个常数因子”。也就是说,如果你遵循最近最少使用法,即在把某项放回列表中时,总是把它放到列表的最前面,那么你花在搜索上的时间就不会超过你在预知未来的情况下所需时间的两倍。任何其他算法都无法保证取得同样效果。
1700495444
1700495445
一旦认识到野口文件归档系统是最近最少使用原则的一个实例,我们就知道它不仅是一种有效策略,实际上还是最优策略。
1700495446
1700495447
斯雷特和陶尔扬的研究结果告诉我们,如果将野口文件归档系统翻转90度,就可以实现一个新的变化。很简单,一盒文件夹就成了一堆文件夹。如果你搜索的是成堆的文件夹,那么搜索顺序自然是从上至下,而且每次你把一个文件放回去的时候,你都不会把它放回到原来的位置,而是放到最上面。[1]
1700495448
1700495449
简而言之,自组织列表的数学计算会为我们提供一些激进的建议:你根本没有必要因为案头文件成堆而自责,因为这不是杂乱无序的标志,而是最精心设计和最有效的组织形式之一。在别人看来,这是一种没有组织的混乱局面,但是实际上,它是一个自组织混乱。把东西扔回成堆物品的顶部,是你在无法预测未来时可以采取的最有效的做法。在前一章中,我们发现,在某些情况下,花时间排序之后,效率不升反降。这里,我们同样建议,在某些情况下不需要考虑如何管理的问题,不过理由有所不同:因为你其实已经组织得很好了。
1700495450
1700495451
[1]你也可以让电脑把电子文件以文件堆的形式显示在你的眼前。在计算机默认的文件浏览界面,你可以按字母顺序点击文件夹。但是,强大的最近最少使用法建议你放弃这个方案,在显示文件堆时用“最后打开”取代“名称”。这样,你正要寻找的文件基本上一定是在顶部或靠近顶部的位置。
1700495452
1700495453
1700495454
1700495455
1700495457
算法之美:指导工作与生活的算法 遗忘曲线
1700495458
1700495459
当然,在讨论存储器时如果不提及与家庭最密切的“记忆器官”——人类大脑,那么整个讨论就会显得不够完整。在过去的几十年里,由于受到计算机科学的影响,心理学家对记忆的认识发生了翻天覆地的变化。
1700495460
1700495461
据说,人类记忆研究始于1879年。当时,柏林大学一位名叫赫尔曼·埃宾豪斯的年轻心理学家希望弄清人类记忆的作用原理,并向人们证明,利用自然科学在数学方面的严谨要求来研究大脑是可行的。于是他开始在自己身上做实验。
1700495462
1700495463
每天,埃宾豪斯都会坐下来,背诵一大堆无意义的音节。然后,他会利用前几天列出的列表测试自己的记忆效果。在一年的时间里,他始终坚持这个行为,并证实了人类记忆研究过程中得出的许多最基本的结论。例如,他证实,在背诵音节列表时,增加联系的次数会使记忆持续更久,而随着时间的推移,一个人能够准确回忆的内容会减少。他的研究结果可以绘制成记忆随时间流逝的关系图,心理学家今天称之为“遗忘曲线”。
1700495464
1700495465
埃宾豪斯的研究结果证实了人类记忆定量研究的可信度,但他留下了一些未解之谜。为什么记忆效果会形成这种曲线?从这个曲线能看出人的记忆力是好还是不好?曲线背后隐藏了什么信息?100多年来,这些问题让心理学家百思不得其解,并激励他们继续深入研究。
1700495466
1700495467
1987年,卡内基-梅隆大学的心理学家、计算机科学家约翰·安德森为了解大学图书馆的信息检索系统,查阅了大量资料。他的目标,或者说他自认为的目标,是弄清楚信息检索系统的设计是否可以从人类记忆研究那里获取灵感。结果,他发现现实正好相反:信息科学有可能为人类大脑研究填补某些空白。
1700495468
1700495469
安德森说:“很长一段时间以来我都觉得,现有的人类记忆理论,包括我自己提出的记忆理论,都缺少某些东西。基本上,所有这些理论都认为记忆具有随意性,而且没有优化配制……我一直觉得基本记忆过程具有很强的适应能力,甚至可以取得最佳效果。但是,我从来没有找到合适的框架来说明这一点。在计算机科学领域关于信息检索的研究中,我看到了梦寐以求的那个框架。”
1700495470
1700495471
我们往往很自然地认为,遗忘是大脑存储空间被全部占用造成的结果。在安德森对人类记忆的新描述中,其核心思想是,需要解决的可能不是存储问题,而是如何组织的问题。他认为,大脑的记忆能力基本上是无限的,但我们在大脑中搜索的时间是有限的。安德森把大脑比喻成图书馆,不过这个图书馆只有一个无限长的书架,也就是说,是一个美国国会图书馆级别的野口文件归档系统。你可以在那个书架上放无数本书,但是,书的位置越靠近前面,就越容易被找到。
1700495472
1700495473
关乎人类记忆好坏的关键因素就和决定计算机高速缓存效果的关键因素一样,都是看我们能否预测未来我们最有可能需要什么。
[
上一页 ]
[ :1.700495424e+09 ]
[
下一页 ]