1700494599
算法之美:指导工作与生活的算法 什么是探索与利用
1700494600
1700494601
英语为“explore”(探索)和“exploit”(利用)这两个词赋予了截然相反的含义,但是在计算机科学家眼中,它们有很多具体的中性含义。简单地说,探索的意思是收集信息,而利用则指利用所拥有的信息,以产生一个好的结果。
1700494602
1700494603
凭直觉就知道,探索在人生中是不可或缺的。但是,我们同样应该知道,如果缺少了利用,人生也必然无比惨淡。根据计算机科学的定义,很多时候,利用其实是我们心目中的那些美妙时光的一个特征。节假日的家庭聚会就是一种利用。书迷安静地坐在椅子上,一边喝着热腾腾的咖啡,一边阅读自己心仪的书;乐队在狂热的歌迷面前演唱自己的畅销金曲;经受住岁月考验的夫妇在“属于他们的乐曲”中翩翩起舞。所有这些,都是一种利用。
1700494604
1700494605
有时候,探索还有可能为我们埋下祸根。
1700494606
1700494607
例如,音乐的魅力之一就是新的音乐作品层出不穷。但是,如果你是一名音乐记者,那么不断推出的新作品就会让你觉得头疼。选择音乐记者这个行业,就意味着把探索进行到极致,无时无刻不在接触新鲜事物。乐迷可能认为从事这个行业就像生活在天堂一样,但是,如果你一直忙于探索新的事物,就永远没有办法享受你的鉴赏成果,所以这与天堂般的生活相去甚远。音乐网站Pitchfork的前主编斯科特·普拉奇霍夫在这方面感慨颇深。他对批评家的生活是这样评价的:“在工作期间,你很难找到时间听自己想听的音乐。”由于长时间鉴赏那些质量不确定的新歌,因此他特别希望听一听自己喜欢的歌曲。为了抵制这种强烈愿望的诱惑,普拉奇霍夫会在他的iPod(苹果播放器)中存放新的音乐作品,通过这个物理障碍来保证自己不会忘记职责,即使他有的时候特别想听史密斯乐队的歌曲。音乐记者本着殉道者的精神,默默探索,为其他人的利用创造条件。
1700494608
1700494609
在计算机科学中,探索与利用的矛盾通过“多臂老虎机问题”的形式表现得淋漓尽致。这个奇怪的名称来源于赌场老虎机的俗称——“独臂匪徒”。假设你走进一家赌场,里面全部是各种各样的老虎机,但是每台机器吐钱的概率各不相同。问题是,你提前不知道这些概率到底是多少。在你开始游戏之前,你根本不知道哪台机器最喜欢吐钱,哪台机器只吞钱不吐钱。
1700494610
1700494611
你自然希望赢的钱越多越好。显然,你肯定会在不同机器上亲自测试一番(探索),然后专挑那些你认为最有可能吐钱的机器来玩游戏(利用)。
1700494612
1700494613
为了弄明白这个问题的微妙之处,我们假设房间里只有两台老虎机。你在一台机器上玩了15次,其中有9次老虎机吐出了一些钱,还有6次没有任何反应。你在另一台机器上只玩了两次,其中一次老虎机吐出了钱,另一次则没有吐钱。哪一台机器更有可能让你赢钱?
1700494614
1700494615
把赢钱的次数与总次数相除,就可以计算出各台机器的“期望值”。利用这个方法比较时,第一台机器显然更胜一筹。9-6这个游戏记录表明它的期望值是60%,而第二台机器的1-1记录只能得出50%这个期望值。不过,仅仅这样考虑还是不够的。毕竟,只玩两次,次数还是太少了。因此,从某种意义上讲,我们仍然不知道第二台机器的实际表现如何。
1700494616
1700494617
选择餐厅或者唱片就等同于选择一台老虎机,去玩生活这个游戏。但是,了解探索与利用的取舍问题,不仅可以帮助我们挑选餐厅和歌曲,还可以帮助我们深入了解如何随着年龄的增长调整我们的人生目标,了解最合理的做法为什么并不总是选择最好的。事实证明,探索与利用的取舍问题在网页设计与临床试验(以及其他领域)中占有核心地位——正常情况下,这两个名词不会出现在同一个句子中。
1700494618
1700494619
人们往往将决策行为孤立开来,针对每一次决策活动寻找在结果中实现最高期望值的方法。但是,决策行为几乎都不是孤立的,期望值也不是最终目标。如果你考虑的不是下一个决定,而是在将来面对相同选择方案时你将做出的所有决定,探索与利用的取舍就会发挥重要作用。数学家彼得·惠特尔认为,从本质上看,老虎机问题正是通过这种方式“体现了所有人类行为中显而易见的矛盾”。
1700494620
1700494621
那么,你到底应该在那两台老虎机中选择哪一台呢?这是一个带有陷阱的问题,因为答案完全取决于一个我们至今还没有讨论的内容:你准备在赌场玩多长时间?
1700494622
1700494623
1700494624
1700494625
1700494627
算法之美:指导工作与生活的算法 如何利用剩余时间?
1700494628
1700494629
在1989年上映的电影《死亡诗社》中,一个令人难忘的场景是彼得·威廉姆斯呼吁道:“抓住现在,孩子们,要抓住每一天,让你们的生活变得非凡起来。”
1700494630
1700494631
这条建议非常重要,同时也有点儿自相矛盾。抓住一天与抓住一辈子的时光是完全不同的两个概念。的确,有人说:“吃喝享乐吧,因为明天我们就会死去。”但是,我们或许应该反过来说:“让我们学一门新的语言或者乐器,或者与陌生人随便聊聊吧。生命如此漫长,谁知道多年之后哪一朵快乐之花会绽放。”当我们在喜爱的体验与新鲜的体验之间取得平衡时,最重要的莫过于为享受这些体验制订计划的那个中间环节。
1700494632
1700494633
数据科学家、博主克里斯·斯图吉奥解释说:“刚刚搬到一座城市时,我更有可能去尝试新的餐厅,但是当我准备从一座城市搬走时,这种可能性就会降低。”这位善于处理工作、生活中探索与利用这一取舍问题的老手说:“现在,我在大多数情况下都会去我熟悉、喜爱的餐厅,因为我知道我很快就会离开纽约了。但是,几年前刚到印度的浦那市时,我几乎吃遍了这座城市,只要看起来毒不死人的东西,我都会去尝试一下。当我准备离开那座城市时,我又开始吃我过去就喜欢吃的东西,而不是到处尝试新的食物……即使我发现某个地方还不错,我也只会去一两次。何必再冒那个险呢?”
1700494634
1700494635
随着时间的推移,即使探索有所发现,我们可以认真品味这些新发现的机会也已经所剩无几,因此探索的价值随之降低。在你离开一座城市的前夜,你发现一家酒吧非常棒,但是你已经没有机会去第二次了。这一点可以让我们清醒下来,不至于一味地尝试新鲜事物。
1700494636
1700494637
与之相反,利用的价值随着时间的推移反而会不断上升。本质上,现在你心目中最迷人的酒吧至少不逊于上个月你心目中最迷人的酒吧。(如果后来你发现你喜欢上了另一家酒吧,那就说明这家酒吧可能更棒。)因此,当你有时间使用探索带来的知识时,就大胆探索。当你准备兑现探索的成果时,就尽情利用。利用好剩余时间就是正确的应对之策。
1700494638
1700494639
有趣的是,既然应对之策是利用好剩余时间,那么通过研究人们采用的策略,我们也可以推断出剩余时间的起始点与结束点。以好莱坞为例。1981年,票房排行榜前10名的电影中只有两部是续集;1991年,前10名中有三部续集;2001年,这个数字上升到了5部;2011年,票房前10名电影中有8部都是续集。事实上,续集在2011年各大公司电影作品中所占的比例创造了一个新纪录。但是,这个纪录在2012年就被打破了,到2013年又再次被打破。2012年12月,记者尼克·艾伦对来年的电影前景进行了展望。他的热情明显不是很高:
1700494640
1700494641
观众将第6次看到X战警,还将看到《速度与激情6》《虎胆龙威5》《惊声尖笑5》和《鬼影实录5》。此外,他们还会看到《钢铁侠3》和《宿醉3》,以及《布偶大电影》《蓝精灵》《特种部队》和《圣诞坏公公》的续集。
1700494642
1700494643
在电影公司看来,续集可以保证观众基础,是稳赚不赔的买卖,是可以享受的成果。但是,因为稳赚不赔就一拥而上,说明他们的目标非常不长远,这与斯图吉奥即将离开一座城市之前的行为非常相似。与全新的电影相比,续集更有可能成为当年的热门电影,但是未来深受观众喜爱的票房保证将从何而来呢?蜂拥而至的续集潮不仅令人感到遗憾(影评家肯定是这样想的),在一定程度上甚至令人伤感。电影业已经进入了一个安于现状的阶段,这似乎是一个信号,告诉我们电影业已经日薄西山了。
1700494644
1700494645
好莱坞的经济状况与这种预感似乎不谋而合。2007—2011年,各大电影公司的利润下降了40%;在过去10年里,有7年的票房收入走了下坡路。《经济学人》杂志指出:“在成本上升、收益下降的双重压力下,大型电影公司的应对之策是制作续集、前传或者邀请名演员担纲主演,因为他们相信这些电影肯定会火起来。”换句话说,在被淘汰出局之前,他们正争分夺秒,在他们发现的最容易吐钱的“老虎机”上进行赌博游戏。
1700494646
1700494647
[
上一页 ]
[ :1.700494598e+09 ]
[
下一页 ]