打字猴:1.70049478e+09
1700494780
1700494781 如果在过去10年里你使用过互联网,那么你就已经成为其他人考虑的探索与利用问题中的一分子了。企业希望找到利润的主要来源,同时又希望尽可能赚取更多的利润,因此他们探索、利用。亚马逊、谷歌等大型科技公司在2000年前后开始在他们的用户身上进行实时A/B测试,随后互联网在几年时间里就变成了全世界规模最大的对照实验。那么这些企业探索和利用的对象是什么?一言以蔽之,就是:让你移动鼠标、掏腰包。
1700494782
1700494783 企业A/B测试的内容包括站点导航、主题行和营销邮件的投送时间,有时甚至包括公司的某些实际要素和定价。除了公开的谷歌搜索算法和公开的亚马逊结账流程以外,现在的企业还会在不告知用户的情况下对网页进行一些神秘而微妙的变更。(2009年,谷歌就曾有测试41种蓝色以确定某个工具条颜色的行为。)在某些情况下,任何两个用户可能都不会得到完全相同的体验。
1700494784
1700494785 数据科学家、脸书(Facebook)数据小组前负责人杰夫·哈默巴赫曾告诉《彭博商业周刊》:“我们这代人中最聪明的人正在想方设法让人点击广告。”艾伦·金斯堡在诗作《嚎叫》中用一句不朽的诗句形容“垮掉的一代”:我看见我们这一代人中最聪明的人毁于疯狂的行为。同样,我们也可以把哈默巴赫的这句话视为千禧年的“嚎叫”。对于这种情况,哈默巴赫的看法是“糟透了”。但是,无论人们如何利用网络,在网络上做实验以研究人们的点击行为都是可以的,而且链接可以指向过去的营销人员根本想不到的地方。
1700494786
1700494787 当然,我们都知道2008年奥巴马的参选结果。但是,有人知道他的分析团队负责人丹·西罗克的去向吗?奥巴马就任总统后,西罗克回到了美国西部,与谷歌的同事皮特·库曼合作创办了网站优化公司Optimizely。2012年,当又一轮的总统选举拉开帷幕时,该公司的客户名单里不仅包含奥巴马竞选连任的团队,还可以看到奥巴马的挑战者、共和党候选人米特·罗姆尼的竞选团队。
1700494788
1700494789 A/B测试大约于10年前首次被使用,如今这个优化利器已经脱下了神秘的外衣,并且理所当然地植入到网络上的经营行为与政治活动之中。当你再一次打开浏览器时,你眼前的色彩、图片、文本甚至定价(当然还有广告)肯定都是探索与利用算法根据你的鼠标点击为你量身定制的。在这个特定的多臂老虎机问题中,你不是那名赌徒,而是奖池中的累积奖金。
1700494790
1700494791 几年来,A/B测试的程序也越来越完善。A/B测试最经典的做法是将流量均分给两个选择方案,测试一段时间之后,再将所有流量都分配给获胜一方。但是,这种做法将导致一半用户在测试的过程中只能接受较差的那个方案,因此它未必最有利于解决问题。如果可以找到更好的做法,就有可能得到丰硕的回报。在谷歌近500亿美元的年收入额中,超过90%的比例来自付费广告,而互联网商务一年的成交额为数千亿美元。这说明探索与利用算法是互联网的一个非常重要的经济技术动力来源。关于最优算法的争论一直甚嚣尘上,统计学家、工程师和博客作者就各种经营环境下探索与利用的最有效平衡方法这个问题争论不休。
1700494792
1700494793 精确地区分人们在探索与利用问题上的不同观点似乎是一件晦涩难懂的事情,但是事实证明,区分这些观点非常重要,这不仅与总统选举和互联网经济有关,而且与人们的生活也有密不可分的关系。
1700494794
1700494795
1700494796
1700494797
1700494798 算法之美:指导工作与生活的算法 [:1700494118]
1700494799 算法之美:指导工作与生活的算法 试验中的临床试验
1700494800
1700494801 1932—1972年,亚拉巴马州梅肯县有数百名非裔美国人患有梅毒,但是医学专业人士故意不予治疗。这是美国公共卫生服务机构“塔斯基吉梅毒研究”40年实验的一部分。1966年,公共卫生服务部门的员工彼得·巴克斯顿提出抗议,并于1968年提出了第二次抗议。但是,直到他把这件事透露给媒体(1972年7月25日,《华盛顿星报》刊登了相关内容,第二天《纽约时报》也在头版头条上讨论了这件事)之后,美国政府才停止了这项研究。
1700494802
1700494803 公众对此提出了强烈抗议,随后国会举行听证会,并裁决必须采取措施规范医学伦理的原则和标准。1979年,在马里兰州贝尔蒙特会议中心召开的委员会出台了一份被称作“贝尔蒙特报告”的文件。《贝尔蒙特报告》为医学实验的伦理实践奠定了基础,从此以后,塔斯基吉实验这种令人震惊的、明显不恰当的、违背卫生职业对病人应尽义务的行为永远不会重演。但该文件也注意到,在许多其他情况下,问题的性质很难精确界定。
1700494804
1700494805 报告指出:“希波克拉底的格言‘不伤害’一直是医学伦理的基本原则,生理学家克劳德·伯纳德把它扩展到研究领域,指出一个人不应该伤害另一个人,无论他的行为可以给其他人带来何种好处。然而,即使避免伤害也需要知道什么是有害的。在获取这些信息的过程中,人们可能会有受到伤害的风险。”
1700494806
1700494807 因此,《贝尔蒙特报告》承认,以自己掌握的最有效信息指导自己行动和收集更多信息之间存在矛盾,但是该报告没有给出解决办法。此外,它还表明,收集知识具有极高的价值,因此即使在某些方面违背正常医学伦理也是可以接受的。报告指出,新药和新疗法的临床试验经常会使某些病人面临受到伤害的危险,尽管这种危险可以通过某些措施降至最低程度。
1700494808
1700494809 仁爱的原则并不一定非常明确。例如,儿科病研究给儿童带来的风险超出了最低限度,短期内却看不到让其他孩子从中受益的希望,这是儿科病研究面临的一个难以处理的伦理问题。一些人认为这样的研究是不可接受的,另一些人则指出,如果加以限制,很多有望在未来给孩子们带来巨大裨益的研究就会遭到禁止。同样,正如所有的困难案例一样,仁爱原则涵盖的不同主张可能相互矛盾,并迫使人们做出艰难的选择。
1700494810
1700494811 人们在《贝尔蒙特报告》出台之后几十年里面临的重要问题之一就是临床试验的标准方法是否真的可以将病人面临的风险降至最低。某个传统的临床试验将病人分成若干小组,每个小组在研究过程中接受不同的治疗。(只有在极其特殊的情况下,实验才会提前终止。)这个程序关注的焦点是明确回答哪种治疗方案效果更好,而不是为接受实验的每一名病人提供最有效的治疗。一部分病人在整个实验期间接受的治疗最终被证明效果较差,这与网站的A/B测试没有任何不同。但是,在实验进行的同时,医生(科技公司同样如此)就已经在收集有关各方案治疗效果的信息,这些信息不仅可以在实验结束之后用来改进未来病人的治疗,而且同样适用于正在实验中接受治疗的病人。
1700494812
1700494813 优化网站配置的实验会造成成千上万美元的影响,但是在临床试验中,寻找最有效治疗方案的实验直接关乎病人的生死。越来越多的医生和统计人员认为我们的做法是不正确的。他们主张,我们应该把医疗方案选择问题视为多臂老虎机问题,在实验正在进行的同时努力寻找更好的治疗方法。
1700494814
1700494815 1969年,马文·泽伦(现在是哈佛大学的一名生物统计学家)建议采用“自适应性”试验。他提出的一个建议是随机化“胜者优先”算法——另外一个版本的赢留输变算法。根据这个算法,使用某个特定治疗方案的可能性随着每次成功治愈有所增加,反之则会减少。按照泽伦设计的程序,你首先在帽子里放两个小球,分别代表接受研究的两个治疗方案。从帽子中随机拿出一个小球,以确定第一名病人使用哪种治疗方案(随后将小球放回帽中)。如果所选的治疗方案成功地取得了疗效,就在帽子里再放一个代表这种治疗方案的小球。此时,帽子里一共有三个小球,其中有两个代表刚刚取得成功的治疗方案。如果所选的治疗方案失败了,就在帽子里再放一个代表另外一个治疗方案的小球,以增加将来选中该治疗方案的可能性。
1700494816
1700494817 16年后,一项ECMO(体外膜肺氧合)研究在临床试验中首次使用了泽伦的算法。ECMO是密歇根大学的罗伯特·巴特莱特在20世纪70年代提出的一种治疗婴儿呼吸衰竭的大胆方法,它将流向肺部的血液导到体外,利用机器帮助它完成氧合,然后送回心脏。这是一个有风险的极端措施(甚至有形成栓塞的可能性),但是在没有其他选择的情况下,它也不失为一种有可能行得通的方法。1975年,ECMO挽救了加州奥兰治县一个新生女婴的生命。这名即使安装呼吸机也会缺氧的女婴,如今已经40多岁,并且已经结婚生子。但是在早期,ECMO被认为是一种具有高度试验性的技术和程序,在成年病人身上进行的早期研究表明它的疗效并不优于传统治疗方法。
1700494818
1700494819 1982—1984年,巴特莱特和他在密歇根大学的同事对患有呼吸衰竭的新生儿进行了一项研究。研究小组声称,他们知道自己希望解决“拒绝实施未经证实但有可能挽救生命的治疗方法所带来的伦理问题”,并且“不愿意仅仅为了满足传统的随机分配方法的需要,就拒绝为另外一组病人实施可以挽救他们生命的治疗方案”。因此,他们采用了泽伦的算法,并制订了一个试验策略。结果,一名被安排接受“常规”治疗的婴儿病情加重,濒临死亡,而11名接受试验性ECMO治疗的婴儿全部存活了下来。1984年4—11月,在官方研究结束后,另有10名婴儿符合实施ECMO疗法的标准。其中8名患者接受了ECMO治疗,结果8人全部存活。两名患者接受常规治疗,最后均不治而亡。
1700494820
1700494821 这些数字非常引人注目,然而,在密歇根大学对ECMO的研究完成后不久,它就陷入了争论之中。试验中接受常规治疗的患者非常少,这与标准方法有很大的不同,而且这个程序本身具有高度的侵入性和潜在风险。在论文发表后,哈佛大学公共卫生学院生物统计学教授吉姆·维尔和他的卫生学院同事仔细研究了这些数据,并且断定“如果不进行进一步的研究,就无法证明应该将ECMO纳入常规疗法的名单之中”。因此,维尔和同事们设计了第二个临床实验。这一次,他们仍然努力在获取知识和对患者实施有效治疗这两者之间达成平衡,但是选择了使用更温和的设计方案。他们将为患者随机安排ECMO或常规治疗。等到在其中一个组中观察到预先指定的死亡人数之后,就会对所有病人提供更有效的治疗方法。
1700494822
1700494823 在维尔研究的第一阶段,接受常规治疗的10名婴儿中有4人死亡,而接受ECMO治疗的9名婴儿全部存活。这4名婴儿的死亡足以促使研究进入第二阶段,于是全部20名患者都接受了ECMO治疗。最终,19人得以幸存。维尔和同事们终于信服了,并且断言“如果继续随机安排治疗方法,在伦理道义上是无法辩解的”。
1700494824
1700494825 但是,在维尔实施这项研究之前,就已经有人完成了类似研究,并明确提出了相同的观点。批评者包括唐·贝瑞——世界上研究多臂老虎机问题的主要专家之一。贝瑞在发表于《统计科学》杂志上的一篇评论文章中写道:“像维尔研究那样为病人随机安排ECMO以外的治疗方法,是不道德的……在我看来,维尔当初就不应该实施那项研究。”
1700494826
1700494827 然而,即使维尔的研究也没有让医学界的所有人都信服。20世纪90年代,有人又在英国招募了近200名婴儿,进行了另一项ECMO研究。他们没有采用自适应算法,而是遵循传统的方法,将这些婴儿随机分为人数相等的两个小组。研究人员称ECMO的有效性“是有争议的,因为现有证据有不同的解释”。结果,关于这两种治疗方法之间的差别,英国人宣布的结果与美国人在两项研究中得出的结论并不相同,但是英国人仍然宣称他们的研究结果“与先前的初步成果是一致的,即利用ECMO提供支持的治疗方案可以降低死亡风险”。为获取这些知识,他们付出了多大代价!“常规”组婴儿死亡人数比接受ECMO治疗的小组多24人!
1700494828
1700494829 自适应临床试验的结果遭到了普遍抵制,这似乎是一个令人费解的现象。但是,我们可以想一想在20世纪初刚刚出现的统计学对医学产生的影响。本来,每次出现一个新疗法,医生们都需要说服其他医生接受该疗法。但是统计学出现之后,哪些证据可信、哪些证据不可信,就有了明确的标准。修改已经被广为接受的标准统计方法有可能打破这种平衡,至少会暂时打破平衡。
[ 上一页 ]  [ :1.70049478e+09 ]  [ 下一页 ]