1700494758
1700494759
因此,上限置信区间算法与基廷斯指数一样,也为多臂老虎机的每个拉把赋予了一个数值。在上限置信区间算法中,这个数值就是根据目前掌握的信息,计算该拉把在合理情况下可以产生的最高值。因此,该算法不关心截至目前已经取得最好成绩的是哪个拉把,相反,它会选择在合理情况下未来有可能取得最佳成绩的那个拉把。例如,如果你从未去某家餐厅就餐,那么就你了解的信息看,这家餐厅可能非常棒。即使你已经去过一两次并且品尝了两道菜,你获取的信息也不足以表明这家餐厅一定比不上你经常去的那些餐厅。同基廷斯指数一样,上限置信区间一定大于期望值,但是随着某个方案给我们的体验越来越多,两者之间的差就会越来越小。(只有一次中评的餐厅仍然有可能非常棒,但是收到过几百次中评的餐厅一定不会很好。)上限置信区间算法给出的推荐意见与基廷斯指数的推荐意见应该没有多大区别,但是前者的计算难度小得多,而且无须几何贴现这个前提条件。
1700494760
1700494761
上限置信区间算法所采用的原理有一个绰号——“面对不确定性时的乐观主义”。他们指出这种乐观主义是有充分理由的。这些算法强调通过已知证据推断某个选择方案可能产生的最佳结果,而计算的结果倾向于我们了解程度较低的可能情况。因此,他们自然会在决策过程中增加探索的比重,满怀热情地选择新的事物,因为任何新鲜事物接下来都可能变得非常重要。麻省理工学院的莱斯利·基布灵就曾采用相同的原理,她设计的“乐观机器人”在探索周围空间时,赋予未知地形的值比较高。显然,这个原理对于人类生活同样有所启示。
1700494762
1700494763
上限置信区间算法的成功,是对怀疑者的一个正式回应。根据这些算法给出的建议,我们应该满怀激情地结识新人,尝试新鲜事物,因为在没有相反证据的时候,我们都应该假定可以取得最好的结果。从长远看,乐观主义是防范遗憾的最有效措施。
1700494764
1700494765
1700494766
1700494767
1700494769
算法之美:指导工作与生活的算法 网上“土匪”
1700494770
1700494771
2007年,谷歌的产品经理丹·西罗克向公司请假,去参加当时身为参议员的巴拉克·奥巴马在芝加哥举行的总统竞选活动。作为“新媒体分析”团队的负责人,西罗克把谷歌在网站上的一个做法移植到鲜红的总统竞选“捐款”按钮上。结果令人大吃一惊——他的这个举动直接促使捐款金额增加了5700万美元。
1700494772
1700494773
西罗克到底对那个按钮做了什么呢?
1700494774
1700494775
答案是A/B测试。
1700494776
1700494777
A/B测试的步骤大概是这样的:某公司为某个网页设计了几个不同的草稿。他们可能想了解不同的颜色、图片、新闻报道标题或者屏幕上各项内容的不同排列有什么样的效果。于是,他们把登录网站的用户随机分配到这些排列不同的页面上,通常各页面的访问人数相等。一个用户可能看到按钮是红色的,另一个用户则可能看到按钮是蓝色的;一个用户可能看到的是“DONATE”(捐款),另一个可能看到的是“CONTRIBUTE”(捐助)。然后,他们对相关的计量体系(例如点击率或者用户平均捐助金额)进行监视。一段时间之后,如果从统计数据可以观察到显著效果,“获胜”的版本通常就会站稳脚跟,或者成为另一轮实验的参考标准。
1700494778
1700494779
西罗克在奥巴马捐赠页面上完成的A/B测试反映了一些问题。对于第一次访问竞选网站的用户,“捐赠并领取礼物”按钮取得了最好的成绩,即使把发放礼物的成本剔除之后,仍然效果最佳。对于长期订阅新闻但是从来没有掏过腰包的访问者,“捐款”按钮效果最好,可能是因为这个表达可以唤起他们的负疚感。对于过去曾经捐过款的访问者,“捐助”按钮吸引追加捐款的效果最好,其中的道理可能是已经“捐款”的人随时可以进一步“捐助”。令竞选团队吃惊的是,在所有情况下,奥巴马的一张简简单单的黑白全家福照片所取得的效果竟然超过团队可以找到的任何其他照片及视频。所有这些独立的优化手段加到一起,产生了巨大的实际效果。
1700494780
1700494781
如果在过去10年里你使用过互联网,那么你就已经成为其他人考虑的探索与利用问题中的一分子了。企业希望找到利润的主要来源,同时又希望尽可能赚取更多的利润,因此他们探索、利用。亚马逊、谷歌等大型科技公司在2000年前后开始在他们的用户身上进行实时A/B测试,随后互联网在几年时间里就变成了全世界规模最大的对照实验。那么这些企业探索和利用的对象是什么?一言以蔽之,就是:让你移动鼠标、掏腰包。
1700494782
1700494783
企业A/B测试的内容包括站点导航、主题行和营销邮件的投送时间,有时甚至包括公司的某些实际要素和定价。除了公开的谷歌搜索算法和公开的亚马逊结账流程以外,现在的企业还会在不告知用户的情况下对网页进行一些神秘而微妙的变更。(2009年,谷歌就曾有测试41种蓝色以确定某个工具条颜色的行为。)在某些情况下,任何两个用户可能都不会得到完全相同的体验。
1700494784
1700494785
数据科学家、脸书(Facebook)数据小组前负责人杰夫·哈默巴赫曾告诉《彭博商业周刊》:“我们这代人中最聪明的人正在想方设法让人点击广告。”艾伦·金斯堡在诗作《嚎叫》中用一句不朽的诗句形容“垮掉的一代”:我看见我们这一代人中最聪明的人毁于疯狂的行为。同样,我们也可以把哈默巴赫的这句话视为千禧年的“嚎叫”。对于这种情况,哈默巴赫的看法是“糟透了”。但是,无论人们如何利用网络,在网络上做实验以研究人们的点击行为都是可以的,而且链接可以指向过去的营销人员根本想不到的地方。
1700494786
1700494787
当然,我们都知道2008年奥巴马的参选结果。但是,有人知道他的分析团队负责人丹·西罗克的去向吗?奥巴马就任总统后,西罗克回到了美国西部,与谷歌的同事皮特·库曼合作创办了网站优化公司Optimizely。2012年,当又一轮的总统选举拉开帷幕时,该公司的客户名单里不仅包含奥巴马竞选连任的团队,还可以看到奥巴马的挑战者、共和党候选人米特·罗姆尼的竞选团队。
1700494788
1700494789
A/B测试大约于10年前首次被使用,如今这个优化利器已经脱下了神秘的外衣,并且理所当然地植入到网络上的经营行为与政治活动之中。当你再一次打开浏览器时,你眼前的色彩、图片、文本甚至定价(当然还有广告)肯定都是探索与利用算法根据你的鼠标点击为你量身定制的。在这个特定的多臂老虎机问题中,你不是那名赌徒,而是奖池中的累积奖金。
1700494790
1700494791
几年来,A/B测试的程序也越来越完善。A/B测试最经典的做法是将流量均分给两个选择方案,测试一段时间之后,再将所有流量都分配给获胜一方。但是,这种做法将导致一半用户在测试的过程中只能接受较差的那个方案,因此它未必最有利于解决问题。如果可以找到更好的做法,就有可能得到丰硕的回报。在谷歌近500亿美元的年收入额中,超过90%的比例来自付费广告,而互联网商务一年的成交额为数千亿美元。这说明探索与利用算法是互联网的一个非常重要的经济技术动力来源。关于最优算法的争论一直甚嚣尘上,统计学家、工程师和博客作者就各种经营环境下探索与利用的最有效平衡方法这个问题争论不休。
1700494792
1700494793
精确地区分人们在探索与利用问题上的不同观点似乎是一件晦涩难懂的事情,但是事实证明,区分这些观点非常重要,这不仅与总统选举和互联网经济有关,而且与人们的生活也有密不可分的关系。
1700494794
1700494795
1700494796
1700494797
1700494799
算法之美:指导工作与生活的算法 试验中的临床试验
1700494800
1700494801
1932—1972年,亚拉巴马州梅肯县有数百名非裔美国人患有梅毒,但是医学专业人士故意不予治疗。这是美国公共卫生服务机构“塔斯基吉梅毒研究”40年实验的一部分。1966年,公共卫生服务部门的员工彼得·巴克斯顿提出抗议,并于1968年提出了第二次抗议。但是,直到他把这件事透露给媒体(1972年7月25日,《华盛顿星报》刊登了相关内容,第二天《纽约时报》也在头版头条上讨论了这件事)之后,美国政府才停止了这项研究。
1700494802
1700494803
公众对此提出了强烈抗议,随后国会举行听证会,并裁决必须采取措施规范医学伦理的原则和标准。1979年,在马里兰州贝尔蒙特会议中心召开的委员会出台了一份被称作“贝尔蒙特报告”的文件。《贝尔蒙特报告》为医学实验的伦理实践奠定了基础,从此以后,塔斯基吉实验这种令人震惊的、明显不恰当的、违背卫生职业对病人应尽义务的行为永远不会重演。但该文件也注意到,在许多其他情况下,问题的性质很难精确界定。
1700494804
1700494805
报告指出:“希波克拉底的格言‘不伤害’一直是医学伦理的基本原则,生理学家克劳德·伯纳德把它扩展到研究领域,指出一个人不应该伤害另一个人,无论他的行为可以给其他人带来何种好处。然而,即使避免伤害也需要知道什么是有害的。在获取这些信息的过程中,人们可能会有受到伤害的风险。”
1700494806
1700494807
因此,《贝尔蒙特报告》承认,以自己掌握的最有效信息指导自己行动和收集更多信息之间存在矛盾,但是该报告没有给出解决办法。此外,它还表明,收集知识具有极高的价值,因此即使在某些方面违背正常医学伦理也是可以接受的。报告指出,新药和新疗法的临床试验经常会使某些病人面临受到伤害的危险,尽管这种危险可以通过某些措施降至最低程度。
[
上一页 ]
[ :1.700494758e+09 ]
[
下一页 ]