1700494627
算法之美:指导工作与生活的算法 如何利用剩余时间?
1700494628
1700494629
在1989年上映的电影《死亡诗社》中,一个令人难忘的场景是彼得·威廉姆斯呼吁道:“抓住现在,孩子们,要抓住每一天,让你们的生活变得非凡起来。”
1700494630
1700494631
这条建议非常重要,同时也有点儿自相矛盾。抓住一天与抓住一辈子的时光是完全不同的两个概念。的确,有人说:“吃喝享乐吧,因为明天我们就会死去。”但是,我们或许应该反过来说:“让我们学一门新的语言或者乐器,或者与陌生人随便聊聊吧。生命如此漫长,谁知道多年之后哪一朵快乐之花会绽放。”当我们在喜爱的体验与新鲜的体验之间取得平衡时,最重要的莫过于为享受这些体验制订计划的那个中间环节。
1700494632
1700494633
数据科学家、博主克里斯·斯图吉奥解释说:“刚刚搬到一座城市时,我更有可能去尝试新的餐厅,但是当我准备从一座城市搬走时,这种可能性就会降低。”这位善于处理工作、生活中探索与利用这一取舍问题的老手说:“现在,我在大多数情况下都会去我熟悉、喜爱的餐厅,因为我知道我很快就会离开纽约了。但是,几年前刚到印度的浦那市时,我几乎吃遍了这座城市,只要看起来毒不死人的东西,我都会去尝试一下。当我准备离开那座城市时,我又开始吃我过去就喜欢吃的东西,而不是到处尝试新的食物……即使我发现某个地方还不错,我也只会去一两次。何必再冒那个险呢?”
1700494634
1700494635
随着时间的推移,即使探索有所发现,我们可以认真品味这些新发现的机会也已经所剩无几,因此探索的价值随之降低。在你离开一座城市的前夜,你发现一家酒吧非常棒,但是你已经没有机会去第二次了。这一点可以让我们清醒下来,不至于一味地尝试新鲜事物。
1700494636
1700494637
与之相反,利用的价值随着时间的推移反而会不断上升。本质上,现在你心目中最迷人的酒吧至少不逊于上个月你心目中最迷人的酒吧。(如果后来你发现你喜欢上了另一家酒吧,那就说明这家酒吧可能更棒。)因此,当你有时间使用探索带来的知识时,就大胆探索。当你准备兑现探索的成果时,就尽情利用。利用好剩余时间就是正确的应对之策。
1700494638
1700494639
有趣的是,既然应对之策是利用好剩余时间,那么通过研究人们采用的策略,我们也可以推断出剩余时间的起始点与结束点。以好莱坞为例。1981年,票房排行榜前10名的电影中只有两部是续集;1991年,前10名中有三部续集;2001年,这个数字上升到了5部;2011年,票房前10名电影中有8部都是续集。事实上,续集在2011年各大公司电影作品中所占的比例创造了一个新纪录。但是,这个纪录在2012年就被打破了,到2013年又再次被打破。2012年12月,记者尼克·艾伦对来年的电影前景进行了展望。他的热情明显不是很高:
1700494640
1700494641
观众将第6次看到X战警,还将看到《速度与激情6》《虎胆龙威5》《惊声尖笑5》和《鬼影实录5》。此外,他们还会看到《钢铁侠3》和《宿醉3》,以及《布偶大电影》《蓝精灵》《特种部队》和《圣诞坏公公》的续集。
1700494642
1700494643
在电影公司看来,续集可以保证观众基础,是稳赚不赔的买卖,是可以享受的成果。但是,因为稳赚不赔就一拥而上,说明他们的目标非常不长远,这与斯图吉奥即将离开一座城市之前的行为非常相似。与全新的电影相比,续集更有可能成为当年的热门电影,但是未来深受观众喜爱的票房保证将从何而来呢?蜂拥而至的续集潮不仅令人感到遗憾(影评家肯定是这样想的),在一定程度上甚至令人伤感。电影业已经进入了一个安于现状的阶段,这似乎是一个信号,告诉我们电影业已经日薄西山了。
1700494644
1700494645
好莱坞的经济状况与这种预感似乎不谋而合。2007—2011年,各大电影公司的利润下降了40%;在过去10年里,有7年的票房收入走了下坡路。《经济学人》杂志指出:“在成本上升、收益下降的双重压力下,大型电影公司的应对之策是制作续集、前传或者邀请名演员担纲主演,因为他们相信这些电影肯定会火起来。”换句话说,在被淘汰出局之前,他们正争分夺秒,在他们发现的最容易吐钱的“老虎机”上进行赌博游戏。
1700494646
1700494647
1700494648
1700494649
1700494651
算法之美:指导工作与生活的算法 赢留输变
1700494652
1700494653
事实证明,要用优化算法来处理多臂老虎机问题,难度非常大。彼得·惠特尔回忆说,“二战”期间,这个问题“令同盟国的分析人员身心俱疲……于是有人提议,把这个问题作为破坏智力的终极工具,交给德国人研究”。
1700494654
1700494655
战后,人们通过几年的研究,取得了若干进展。哥伦比亚大学的数学家赫伯特·罗宾斯提出了一个简单的策略,并指出,尽管这个策略尚不完善,但是可以给出一些效果不错的建议。
1700494656
1700494657
在具体考虑了只有两台老虎机的情况之后,罗宾斯提出了赢留输变算法:随便选择一台老虎机,只要它不断吐钱,就在这台机器上玩游戏。如果某次拉动拉把后,老虎机没有吐钱,就换另一台机器。1952年,罗宾斯提出的这个简单策略虽然远不完善,但是效果肯定比碰运气好。
1700494658
1700494659
在罗宾斯之后,不少人进一步研究了“赢留输变”原则,并发表了一系列论文。根据直觉,如果你本来就倾向于某台老虎机,而且这台机器刚刚又让你赢了一些钱,那么你对这台机器的评估就会升值,肯定不介意在这台机器上再玩一次。事实证明,在很多情况下,赢就留下原则都是探索与利用平衡问题优化策略的一个组成部分。
1700494660
1700494661
但是,输就走人这个原则就值得商榷了。不吐钱就换机器是一种非常草率的行为。假设你去一家餐厅用餐。你去过一百次,每次都感到非常满意。如果有一次你感到失望,会不会从此以后就再也不去这家餐厅了呢?正确的做法是不要对瑕疵惩戒过重。
1700494662
1700494663
更重要的是,赢留输变不含任何剩余时间的概念,因此没有为优化行为留出时间。你去你喜爱的餐厅用餐,结果扫兴而归,那么这个算法就会建议你以后换一家餐厅,即使你明天就要离开这座城市了。
1700494664
1700494665
不过,罗宾斯开启了多臂老虎机问题研究的先河,在随后几年里,这个领域涌现出大量的文献资料,研究人员也取得了重大进展。美国兰德公司的数学家理查德·贝尔曼发现,当我们预先知道所有的可选方案以及赢钱机会时,就能求出这个问题的精确解。就如全信息秘书问题的解法一样,贝尔曼基本上也采用了逆向法。首先,他假设自己知道之前所有决策会产生的结果,然后考虑应该在哪一台老虎机上最后一次拉下拉把。推算出结果之后,他再考虑倒数第二次的情况,然后是倒数第三次、倒数第四次,一直倒推到最开始。
1700494666
1700494667
贝尔曼的这个方法肯定可以得到确定无疑的答案,但是,如果可能的选择与赌博的轮次都非常多时,工作量就会非常大(甚至大到无法完成的程度)。此外,即使我们可以计算出未来的所有可能情况,我们也不一定确切地知道我们到底有多少赢钱机会(甚至不知道有多少种选择方案)。因此,多臂老虎机问题从本质上讲还没有得到解决。用惠特尔的话说:“它很快就变成了一个经典问题,同时也变成了永不妥协的代名词。”
1700494668
1700494669
1700494670
1700494671
1700494673
算法之美:指导工作与生活的算法 基廷斯指数
1700494674
1700494675
特例往往是通往宇宙奥秘的大门,这种情况在数学中也经常发生。20世纪70年代,联合利华公司请年轻的数学家约翰·基廷斯帮助他们优化药物试验。令人意想不到的是,基廷斯竟然解开了一道难住了一代数学家的难题。
[
上一页 ]
[ :1.700494626e+09 ]
[
下一页 ]