打字猴:1.700494638e+09

1700494638

1700494639 有趣的是，既然应对之策是利用好剩余时间，那么通过研究人们采用的策略，我们也可以推断出剩余时间的起始点与结束点。以好莱坞为例。1981年，票房排行榜前10名的电影中只有两部是续集；1991年，前10名中有三部续集；2001年，这个数字上升到了5部；2011年，票房前10名电影中有8部都是续集。事实上，续集在2011年各大公司电影作品中所占的比例创造了一个新纪录。但是，这个纪录在2012年就被打破了，到2013年又再次被打破。2012年12月，记者尼克·艾伦对来年的电影前景进行了展望。他的热情明显不是很高：

1700494640

1700494641 观众将第6次看到X战警，还将看到《速度与激情6》《虎胆龙威5》《惊声尖笑5》和《鬼影实录5》。此外，他们还会看到《钢铁侠3》和《宿醉3》，以及《布偶大电影》《蓝精灵》《特种部队》和《圣诞坏公公》的续集。

1700494642

1700494643 在电影公司看来，续集可以保证观众基础，是稳赚不赔的买卖，是可以享受的成果。但是，因为稳赚不赔就一拥而上，说明他们的目标非常不长远，这与斯图吉奥即将离开一座城市之前的行为非常相似。与全新的电影相比，续集更有可能成为当年的热门电影，但是未来深受观众喜爱的票房保证将从何而来呢？蜂拥而至的续集潮不仅令人感到遗憾（影评家肯定是这样想的），在一定程度上甚至令人伤感。电影业已经进入了一个安于现状的阶段，这似乎是一个信号，告诉我们电影业已经日薄西山了。

1700494644

1700494645 好莱坞的经济状况与这种预感似乎不谋而合。2007—2011年，各大电影公司的利润下降了40%；在过去10年里，有7年的票房收入走了下坡路。《经济学人》杂志指出：“在成本上升、收益下降的双重压力下，大型电影公司的应对之策是制作续集、前传或者邀请名演员担纲主演，因为他们相信这些电影肯定会火起来。”换句话说，在被淘汰出局之前，他们正争分夺秒，在他们发现的最容易吐钱的“老虎机”上进行赌博游戏。

1700494646

1700494647

1700494648

1700494649

1700494650 算法之美：指导工作与生活的算法 [:1700494114]

1700494651 算法之美：指导工作与生活的算法赢留输变

1700494652

1700494653 事实证明，要用优化算法来处理多臂老虎机问题，难度非常大。彼得·惠特尔回忆说，“二战”期间，这个问题“令同盟国的分析人员身心俱疲……于是有人提议，把这个问题作为破坏智力的终极工具，交给德国人研究”。

1700494654

1700494655 战后，人们通过几年的研究，取得了若干进展。哥伦比亚大学的数学家赫伯特·罗宾斯提出了一个简单的策略，并指出，尽管这个策略尚不完善，但是可以给出一些效果不错的建议。

1700494656

1700494657 在具体考虑了只有两台老虎机的情况之后，罗宾斯提出了赢留输变算法：随便选择一台老虎机，只要它不断吐钱，就在这台机器上玩游戏。如果某次拉动拉把后，老虎机没有吐钱，就换另一台机器。1952年，罗宾斯提出的这个简单策略虽然远不完善，但是效果肯定比碰运气好。

1700494658

1700494659 在罗宾斯之后，不少人进一步研究了“赢留输变”原则，并发表了一系列论文。根据直觉，如果你本来就倾向于某台老虎机，而且这台机器刚刚又让你赢了一些钱，那么你对这台机器的评估就会升值，肯定不介意在这台机器上再玩一次。事实证明，在很多情况下，赢就留下原则都是探索与利用平衡问题优化策略的一个组成部分。

1700494660

1700494661 但是，输就走人这个原则就值得商榷了。不吐钱就换机器是一种非常草率的行为。假设你去一家餐厅用餐。你去过一百次，每次都感到非常满意。如果有一次你感到失望，会不会从此以后就再也不去这家餐厅了呢？正确的做法是不要对瑕疵惩戒过重。

1700494662

1700494663 更重要的是，赢留输变不含任何剩余时间的概念，因此没有为优化行为留出时间。你去你喜爱的餐厅用餐，结果扫兴而归，那么这个算法就会建议你以后换一家餐厅，即使你明天就要离开这座城市了。

1700494664

1700494665 不过，罗宾斯开启了多臂老虎机问题研究的先河，在随后几年里，这个领域涌现出大量的文献资料，研究人员也取得了重大进展。美国兰德公司的数学家理查德·贝尔曼发现，当我们预先知道所有的可选方案以及赢钱机会时，就能求出这个问题的精确解。就如全信息秘书问题的解法一样，贝尔曼基本上也采用了逆向法。首先，他假设自己知道之前所有决策会产生的结果，然后考虑应该在哪一台老虎机上最后一次拉下拉把。推算出结果之后，他再考虑倒数第二次的情况，然后是倒数第三次、倒数第四次，一直倒推到最开始。

1700494666

1700494667 贝尔曼的这个方法肯定可以得到确定无疑的答案，但是，如果可能的选择与赌博的轮次都非常多时，工作量就会非常大（甚至大到无法完成的程度）。此外，即使我们可以计算出未来的所有可能情况，我们也不一定确切地知道我们到底有多少赢钱机会（甚至不知道有多少种选择方案）。因此，多臂老虎机问题从本质上讲还没有得到解决。用惠特尔的话说：“它很快就变成了一个经典问题，同时也变成了永不妥协的代名词。”

1700494668

1700494669

1700494670

1700494671

1700494672 算法之美：指导工作与生活的算法 [:1700494115]

1700494673 算法之美：指导工作与生活的算法基廷斯指数

1700494674

1700494675 特例往往是通往宇宙奥秘的大门，这种情况在数学中也经常发生。20世纪70年代，联合利华公司请年轻的数学家约翰·基廷斯帮助他们优化药物试验。令人意想不到的是，基廷斯竟然解开了一道难住了一代数学家的难题。

1700494676

1700494677 基廷斯（牛津大学统计学教授）认真地思考了联合利华提出的问题：已知有几种不同的化合物，如何以最快的速度确定哪种化合物可能对哪种疾病有效？基廷斯把这个问题变成了尽可能简单的形式：有多个可选方案，每个可选方案得到回报的概率不同，可分配的精力（金钱或时间）是确定的。于是，这个问题变成了多臂老虎机问题的另外一个化身。

1700494678

1700494679 无论是追逐利润的制药公司，还是他们所在的医药行业，都经常需要面对探索与利用如何取舍的竞争需要。制药公司希望投入到研发部门的资金可以帮助他们发明新药，但是他们同时还希望现在正在帮助他们赚钱的生产线继续开足马力。医生在开处方时，肯定希望病人在现有条件下得到最好的治疗，但是他们也希望实验研究可以找到更有效的治疗手段。

1700494680

1700494681 显而易见，在这两种情况中，我们都无法确定相关的剩余时间到底是什么。从某种意义上讲，制药公司和医生一样，都对不确定的未来感兴趣。制药公司希望可以永远存在下去，而医药行业则希望取得突破，甚至希望在人们出生之前就可以向他们提供帮助。不过，他们对当前时间的重视程度更高：今天就把病人治愈，其价值高于让病人一周以后，甚至一年以后才康复，利润方面当然同样如此。经济学家把这种重现在、轻将来的概念称作“贴现”。

1700494682

1700494683 基廷斯在研究多臂老虎机问题时采用的就是这些术语，这是他与之前的研究人员不同的地方。在他的构想中，他的目标不是在固定时间段里追求最大回报，而是在时间无限长但是价值被打折扣的未来追逐最有利的结果。

1700494684

1700494685 这种贴现在我们自己的生活中并不鲜见。如果你准备在一座城市逗留10天，那么你在选择餐厅时就要记住逗留时间已经确定这个事实，但是，如果你居住在这座城市，时间就没有多大意义了。此时，你也许会想，时间越久，回报贬值的程度就越大：你更关心的是今天的晚餐，而不是明天的晚餐，并且对明天晚餐的关心程度又高于一年之后的晚餐。至于关心程度到底有多大差别，取决于你采用的“贴现函数”。基廷斯设置的条件是回报价值呈几何级数贬值，也就是说，每次去餐厅进餐的价值是上一次的分数倍。如果你认为每天被车撞的可能性为1%，那么在评估明天晚餐的价值时，就应该把它设定为今天晚餐价值的99%，因为你有可能根本没有机会享受明天的晚餐。

1700494686

1700494687 设定了这种几何贴现条件之后，基廷斯提出了这样一个策略：分别考察多臂老虎机的各个拉把，然后计算出各个拉把自己的价值。通过一个别出心裁的设想——贿赂，基廷斯完成了自己的研究，并且认为这个策略“至少可以给出一个效果不错的近似估计”。

[ 上一页 ] [ :1.700494638e+09 ] [ 下一页 ]