1700494517
算法之美:指导工作与生活的算法 见好就收的时机
1700494518
1700494519
1997年,鲍里斯·别列佐夫斯基因拥有大约30亿美元的财产,被《福布斯》杂志确认为俄罗斯首富。仅仅10年前,他还是苏联科学院的一名数学家,靠工资度日。他利用在研究过程中建立的业界关系,创建了一家公司,帮助外国汽车制造商与苏联汽车制造商AvtoVAZ沟通交流。随后,他的公司变成了AvtoVAZ汽车的大型经销商,同时还通过分期付款的方法,利用卢布的恶性通货膨胀牟利。他还利用与AvtoVAZ的合作关系套取资金,用来购买这家汽车制造商及俄罗斯公共电视台、西伯利亚石油公司的部分股份。最终,他赚得了几十亿美元的身家,成为寡头阶层的新成员。随后,他开始参与政治。1996年,他支持鲍里斯·叶利钦连任;1999年,他又支持弗拉基米尔·普京成为叶利钦的继任者。
1700494520
1700494521
但是,后来别列佐夫斯基的政治态度开始转变。普京当选总统之后不久,别列佐夫斯基公开反对普京提出的旨在扩大总统权限的宪政改革。他在公开场合不断批评普京,导致他与普京的关系开始恶化。2000年10月,在有人请普京就别列佐夫斯基对他的批评发表评论时,普京说:“政府手持大棒,只需一下,就能击碎其脑壳。目前我们还没有动用大棒……一旦我们真的动怒,就将毫不犹豫地砸下去。”当年11月,别列佐夫斯基就离开了俄罗斯,再也没有回来。流亡到英国之后,别列佐夫斯基继续批评普京。
1700494522
1700494523
别列佐夫斯基如何做出离开俄罗斯的决定?是否可以通过数学方法考虑“见好就收”这条建议?多年前,别列佐夫斯基本人就是一名数学家,而且他研究的正好就是最优停止问题,他创作的第一本书(当然也是他的唯一一本书)全部关于秘书问题,因此他当时可能也考虑了这个问题。
1700494524
1700494525
人们在分析见好就收这个问题时,为它披上了好几种伪装,但是最适合别列佐夫斯基这种情况的可能应该是“窃贼问题”(向俄罗斯寡头表示歉意)。在窃贼问题中,窃贼可以实施一系列盗窃活动。他们的每次盗窃都会有收获,并且每次都有机会带着战利品顺利脱身。但是,一旦被抓住,他们就会失去之前的所有收获。窃贼希望收获最大,那么什么样的算法可以给他提供合理建议呢?
1700494526
1700494527
窃贼问题有解,对于盗窃题材的电影剧本而言不是好消息。当盗窃团队诱惑一位已经金盆洗手的老手,希望他复出并干最后一票的时候,这位狡猾的窃贼只需要认真分析那些数字就知道该怎么做了。凭直觉也可以得出结果。实施盗窃的次数应该大致等于顺利脱身的可能性除以被抓的可能性的值。如果你是一名有经验的窃贼,每次盗窃成功的可能性为90%(损失全部身家的可能性为10%),那么在盗窃9次(90÷10=9)之后,你就应该洗手不干了。如果是一名笨手笨脚、成功率只有一半的生手,情况会怎么样?第一次去偷盗时,你本来就身无分文,因此无须担心有任何损失,但是之后就不要再去碰运气了。
1700494528
1700494529
尽管别列佐夫斯基是最优停止问题方面的专家,但是他的结局仍然十分凄惨。2013年3月,一名保镖在他位于伯克郡的住所里发现了他的尸体。他死在锁着的浴室里,脖子上系着绳子。官方在尸检之后宣布他死于自杀。由于他在一系列高调的诉讼案中输给了俄罗斯对手,也失去大笔财富,因此他走上了上吊自尽这条不归路。或许他抽身而退的时间还应该更早一些,在积累几千万美元的财富之后就应该收手,而且不能介入政治。但是,遗憾的是,那不是他的做事风格。他在数学界的一位朋友里奥尼德·博古斯瓦夫斯基,曾经讲过别列佐夫斯基的一件往事。当时,他和别列佐夫斯基都还是年轻的研究员。他们前往莫斯科附近,准备进行湖上滑水活动。但是,他们计划使用的那条船出了故障。戴维·霍夫曼在他的《寡头》一书中有这样一段文字:
1700494530
1700494531
朋友们都跑上沙滩,点起了篝火,只有博古斯瓦夫斯基和别列佐夫斯基向船坞走去,准备修理那台发动机……三个小时之后,他们已经把发动机拆装了一遍,但是发动机仍然无法工作。尽管已经错过了聚会的大多数活动,但是别列佐夫斯基仍然坚持说,他们一定要继续尝试修理发动机。博古斯瓦夫斯基回忆说:“我们想尽办法,试图修好那台发动机。”别列佐夫斯基从来不会轻言放弃。
1700494532
1700494533
令人吃惊的是,在最优停止的文献资料中也曾提到过不放弃(而且是永不放弃)。有的时序决策问题似乎没有最优停止准则,尽管从我们前面讨论的大量问题看,似乎不应该出现这种情况。“要么三倍,要么赔光”的博弈游戏就是一个简单的例子。假设你带着1美元去玩这个游戏。游戏规则对轮次没有限制,但是要求你每次都要押上所有的钱,你有50%的机会赢回三倍的钱,另外50%的机会全部赔光。那么你应该参与多少轮呢?尽管这个问题非常简单,但它没有合适的最优停止准则,因为每参加一轮游戏,你的平均收益都会略有增加。从1美元开始,你有一半机会赢回3美元,一半机会收回0美元,平均而言,第一轮结束之后,你装进口袋的现金期望值是1.5美元。那么,如果你在第一轮游戏中运气不错的话,第二轮游戏的两个可能结果就会将你刚刚赢回来的3美元变成9美元或者0美元,也就是说,第二轮的平均收益是4.5美元。数学计算结果表明,你应该一直玩下去。但是,果真如此的话,你最终必将输光所有的钱。可见,有的问题有解,反而会有损无益。
1700494534
1700494535
1700494536
1700494537
1700494539
算法之美:指导工作与生活的算法 随时准备停止
1700494540
1700494541
斯蒂芬·格雷列特
1700494542
1700494543
我的生命只有一次。因此,如果我能做点儿善事,或者可以向人们表示善意,让我现在就做吧!别让我拖延,别让我疏忽,因为我没有第二次生命!
1700494544
1700494545
安妮·迪拉德
1700494546
1700494547
用掉这个下午吧。你不可能把它带走。
1700494548
1700494549
我们在前文讨论了人们在生活中遭遇停止问题的具体实例,很显然,我们大多数人每天都会遭遇这类问题,只不过表现形式各不相同。生活中最优停止问题无处不在,有时与秘书有关,有时又与未婚夫(或未婚妻)、公寓有关。因此我们难免会想到一个问题:进化、教育或者直觉到底能不能为我们提供最有效的策略?
1700494550
1700494551
乍一看,答案似乎是否定的。十几项研究已经得出了相同的结果,人们往往在更优秀申请者还没亮相之前就已经草草停止。为了更深入地了解这些研究成果,我们拜访了加州大学河滨分校的阿姆农·拉波波特。他在实验室里从事最优停止实验工作已有40多年了。
1700494552
1700494553
20世纪90年代,拉波波特与达里尔·希尔合作,完成了一项与经典秘书问题关系密切的研究。在这项研究中,人们需要无数次面对秘书问题,每次申请者的人数为40或者80。结果,人们找到最优秀申请者的总成功率相当不错,大约为31%,与最理想的37%相去不远。大多数人都遵循了摸清情况再行动准则,但是有超过4/5的人出现了出手过早的情况。
1700494554
1700494555
拉波波特告诉我们,他本人在生活中遇到最优停止问题时,都会想到这个现象。例如,在寻租公寓时,他竭力控制自己希望迅速交易的冲动。他说:“尽管我天生是一个急性子,看到第一个公寓就想租下来,但是我还是竭力控制自己。”
1700494556
1700494557
但是,这种不耐烦的表现说明经典秘书问题忽略了另外一个需要考虑的因素——时间。别忘了,在你寻觅秘书的全过程中,你没有秘书可用。此外,你把时间都花在面试上,自己的工作就无法完成了。
1700494558
1700494559
在实验室里解决秘书问题时,停止时机的选择往往过早,原因可能就在于这种成本。希尔和拉波波特认为,如果我们假设面试每名申请者的成本等于发现最优秀秘书所产生价值的1%,那么最优策略就会与实验中人们从观望阶段转变为行动阶段的时间选择正好一致。
1700494560
1700494561
令人难以理解的是,在希尔和拉波波特的研究中,寻觅是不需要付出任何成本的。那么,人们在实验室中的行为为什么与寻觅需要付出成本时一致呢?
1700494562
1700494563
这是因为人们认为时间成本一定是存在的,而且时间成本是在人们的真实生活中产生的,与实验如何设计没有关系。
1700494564
1700494565
因此,寻觅活动的“内在”时间成本(在最优停止模型中通常没有得到体现)也许可以解释人类做出的决策通常与模型的描述之间存在差异的原因。研究最优停止的科研人员尼尔·比尔登指出:“在寻觅工作持续了一段时间之后,我们人类通常就会感到厌烦,即使理性的人也难以避免。但是,模型很难精确地反映出这个变化。”
[
上一页 ]
[ :1.700494516e+09 ]
[
下一页 ]