1700495350
1700495351
原因很简单。如果时间局部性有效,那么粗略排序书架上摆放的就是整幢楼里最重要的图书。这些都是最近被人借阅过的书,所以学生们寻找的可能就是它们。可以说,图书馆的这种做法就相当于把几英里长的书架中最有吸引力、最值得浏览的那些书架藏起来,不向学生开放,而是让态度认真、埋头工作的图书馆员工不断地破坏它们,这似乎是一种非常愚蠢的决定。
1700495352
1700495353
与此同时,墨菲特本科生图书馆的大厅在最显眼、最容易进入的位置摆放一些书架,用来展示图书馆最近添加的图书。这种安排是先进先出缓存的一个具体体现:享受特殊待遇的是图书馆最后添加的图书,而不是刚刚被人借阅过的图书。
1700495354
1700495355
鉴于最近最少使用算法在计算机科学家的大多数测试中占尽优势,我们不妨向图书馆提出一个简单的建议:把图书馆的藏书来个乾坤大挪移。把图书馆刚刚添加的图书放到里面的书架,让需要的人去那里寻找;把最近归还的图书放在大厅里,以方便学生自由浏览。
1700495356
1700495357
人是一种社会生物,也许大学生希望可以培养自己的阅读习惯。大学经常会指定“普通图书”,目的是促进学生建立共同的学术参照点,而学生自行培养阅读习惯的做法将把校园推向一个更有机、更自由的学术参照点。这样,校园里正在阅读的图书,无论是什么内容,都可能成为其他学生偶然发现的好书,这就相当于实施了一种来自草根阶层、自下而上的普通图书计划。
1700495358
1700495359
这样的系统不仅有积极的社会意义,而且可以提高效率,因为最近归还的图书可能很快就会被人再次借阅。也许学生们可能会感到困惑,不知为何受欢迎的图书有时摆放在书架上,有时可以在大厅里找到。因为,曾经的情况是刚刚归还、等候上架的图书既不会出现在书架上,也无法在大厅里找到。在这个短暂的过渡时期,这些图书暂时无法借阅。所以,把刚刚归还的图书摆在大厅里,学生们可以彻底避免受到图书上架的短暂影响,有机会及时借阅这些图书。图书馆员工无须把图书一本本放到书架上,学生们也不必去书库把这些图书拿出来。确切地说,缓存就应该发挥这样的效果。
1700495360
1700495361
1700495362
1700495363
1700495365
算法之美:指导工作与生活的算法 本地需求
1700495366
1700495367
刘易斯·卡罗尔
1700495368
1700495369
“实际上我们绘制了这个国家的地图,采用的是1:1的比例尺!”
1700495370
1700495371
“你们经常使用这幅地图吗?”我问道。
1700495372
1700495373
“这幅地图从来没有被打开过,”米恩·赫尔说,“因为农民不同意。他们说它可以覆盖整个国家,会把阳光遮挡住!所以我们现在就把这个国家本身当作地图使用,我向你保证效果差不多。”
1700495374
1700495375
我们通常认为互联网是一个独立的、连接比较松散的平面网络。事实上,根本不是这么回事。目前,1/4的互联网流量是由一家位于马萨诸塞州的公司处理的,但是这家公司总是想方设法,不让自己出现在头条新闻中。它就是从事缓存业务的阿卡迈公司。
1700495376
1700495377
我们还认为互联网是抽象的、非物质的,属于后地理时代。我们被告知我们的数据“在云里”,意思是指一个遥远而且不确定的地点。同样,这些也都不是真的。真实情况是,互联网完全是由一捆捆电线和一个个金属架组成的,它与地理的联系比你想象的要紧密得多。
1700495378
1700495379
工程师在设计电脑硬件时,考虑的是一个微小尺度上的地理位置:速度更快的内存通常更靠近处理器,这将最大限度地减少信息传输的线路长度。今天的处理器周期是以千兆赫来衡量的,也就是说,它们执行运算所需的时间不到1纳秒。这相当于光传播几英寸[1]的时间——因此计算机内部的物理布局是人们高度关注的焦点。而且,在一个更大的规模上应用同样的原理,实际的地理位置对网络的运行至关重要,因为网络长度不是以英寸为单位的,而是动辄长达数千英里。
1700495380
1700495381
如果你能创建一个网页内容缓存,其实际地理位置更接近那些有需要的人,你就可以更快地为他们提供页面服务。互联网上的大部分流量现在都是由“内容分配网络”来处理的,这些网络利用遍布世界各地的电脑维护流行网站的拷贝。因此,在用户请求使用这些页面时,他们可以从附近的一台计算机获取数据,而不必跨越千山万水,连接到原始服务器上。
1700495382
1700495383
最大的内容分配网络是阿卡迈公司管理的。内容提供商为了接受阿卡迈的服务,提升网站的性能,就需要向它们付费。例如,一个从BBC(英国广播公司)收看视频的澳大利亚人很可能会向位于悉尼的阿卡迈本地服务器提出请求。这个请求根本不会到达伦敦,也没有这个必要。阿卡迈的首席架构师史蒂芬·卢丁说:“我们始终认为距离很重要,我们也是在这个信念的指引下创建我们公司的。”
1700495384
1700495385
在之前的讨论中,我们注意到某些类型的计算机存储器具有更快的性能,但是每个存储单元的成本更大,因此我们希望建成两全其美的“分级存储器体系”。但是我们其实不需要因为缓存的原因而采用不同材料制造存储器。在距离不远时,缓存是个有用的资源,但是性能不同,性能是稀缺资源。
1700495386
1700495387
热门文件应该储存在使用环境附近的位置,这个基本见解也可以应用到实实在在的物理环境中。例如,亚马逊巨大的订单履行中心通常不会使用人类可以理解的任何组织类型,不会采用在图书馆或百货商店里可以看到的那种组织结构。他们告诉员工,可以将进库物品放在仓库里的任何地方(电池可以放到卷笔刀、尿布旁边,烧烤架和感声吉他教学光盘也可以成为“邻居”),然后通过条形码在中央数据库中标记每件物品的位置。但是,这种看似故意为之的无序存储系统仍然有一个明显的例外情况:高需求物品被放置在一个更容易进入的区域。这个区域就是亚马逊的“高速缓存”。
1700495388
1700495389
最近,亚马逊获得了一项创新的专利,使它奉行的这条原则得到了进一步发展。在媒体看来,这项“可预期包裹配送”专利似乎可以帮助亚马逊在你下单之前就把商品送到你的手上。亚马逊和任何一家科技公司一样,都希望拥有贝莱迪式的未卜先知能力,而它们追求的第二目标就是高速缓存。亚马逊的这项专利实际上是最近非常流行的,将商品运送至一个地区的临时仓库,从而为自己的实体商品开辟一个专用的内容分发网络。有人下订单时,商品就已经在他附近的大街上了。预测个人购买行为是有挑战性的,但是当预测数千人的购买行为时,大数定律就会生效。比如某一天,伯克利的一个人想订购再生纸质卫生纸。就在他下单的时候,这些卫生纸已经完成大部分配送环节,很快就会送到。
1700495390
1700495391
当在一个地区深受欢迎的商品也来自该地区时,就会出现“云”这个更有趣的地理位置概念。2011年,影评家米卡尔·莫特思利用网飞公司为美国各州准备的“本地热门”制作了一张美国地图,标注出在这些州特别受欢迎的电影。结果令人大为震惊:绝大多数人都喜欢观看以他们居住地为背景的电影。华盛顿州的人喜欢以西雅图为故事背景的《单身贵族》,路易斯安那州的人喜欢以新奥尔良为背景的《大出意外》,洛杉矶人不出意外地喜欢《L.A.故事》,阿拉斯加人喜欢《挑战阿拉斯加》,而蒙大拿人则喜欢《蒙大拿天空》。[2]因为完整长度的高清视频等文件非常大,所以建立本地“高速缓存”具有极其重要的意义。显然,网飞公司在洛杉矶储存《L.A.故事》的高清视频,是因为电影中的人物就生活在洛杉矶。更重要的是,这部电影的影迷也住在洛杉矶。
1700495392
1700495393
[1]1英寸≈0.025米。——编者注
1700495394
1700495395
[2]缅因州的居民最喜欢《不羁的天空》,但是原因不明。
1700495396
1700495397
1700495398
1700495399
[
上一页 ]
[ :1.70049535e+09 ]
[
下一页 ]