1700496331
算法之美:指导工作与生活的算法 何时应该想得更少?
1700496332
1700496333
就像所有涉及过度拟合的问题一样,如何尽早停止取决于你能衡量的标准和真正重要的因素之间的差距。如果你了解了所有的事实,它们就不会有任何错误和不确定性,你可以直接评估什么对你来说是重要的,然后不要过早的停止。思考的时间长而努力:模型的复杂性和付出的努力都是值得的。
1700496334
1700496335
但事实并非如此。如果你有很高的不确定性和有限的数据,那么务必提前停止。如果你不清楚你的工作将如何被评估,以及由谁来评估,那么你就不值得花额外的时间来对你自己(或者其他人)的特质做出所谓完美的判断。不确定性越大,你所能衡量的东西和真正重要的东西之间的差距就越大,你就越应该注意过度拟合的风险,也就是说,你越喜欢简单,就应该越早停下来。
1700496336
1700496337
当你真正处于黑暗中,最好的计划将是最简单的。当我们对预期不确定,而且得到的数据杂乱无章时,最好的办法就是用一支粗的画笔来画画,用宽大的笔触来思考。有时候,照字面意思来处理就行。正如企业家杰森·弗里德和戴维·H.汉森解释的那样,在他们需要头脑风暴的时候,他们就会用越粗的笔(这是一种用来表达简单化的聪明的方式):
1700496338
1700496339
当我们开始设计某样东西时,我们会用一个大而粗的记号笔勾勒出一些想法,而不是圆珠笔。为什么呢?因为圆珠笔的笔尖太细了。它们的分辨率太高。它们会促使你担心一些你不应该担心的事情,比如完善阴影,或者使用虚线。你最终会专注于那些不应该关注的事情。
1700496340
1700496341
记号笔不会局限住我们。你只能画出形状、线条和盒子。这很好。你最开始应该担心的是大局。
1700496342
1700496343
正如麦吉尔大学的亨利·明茨伯格所说:“如果我们从一个无法衡量什么是最重要的前提出发,又会发生什么?”我们必须用一些非常可怕的东西来代替衡量,那就是判断。
1700496344
1700496345
前期停止的结果是,有时这不是一个在理性和我们的第一直觉之间做出选择的问题。我们的第一反应可以是理性的解决方案。决策越复杂、越不稳定、越不确定,就越要理性。
1700496346
1700496347
再回到达尔文的例子,是否求婚的问题可能已经基于最初他所确认的几个利弊点得到了解决,后续增加的利弊点则会增加考虑时间和焦虑,但并没有帮助他做决定(并且很可能阻碍它)。他脑子里似乎有个想法,那就是:“如果一个人的一生像一只蜜蜂一样工作,工作,其他什么都不做,这是无法忍受的。”孩子和陪伴(他所提到的首要优点)正是那些最终使他选择结婚的原因。他对书的预算是干扰项。
1700496348
1700496349
然而,在我们对达尔文提出批评,把他描绘成一个根深蒂固的过度思考者之前,我们应该再到他的日记中看一看。在他日记的复本中可以看到一些有趣的东西。达尔文不是富兰克林,他在数天内添加了各种各样的考虑因素。尽管他对这一改变命运的选择很认真,但达尔文在他的笔记写到日记本底部的时候,还是下定了决心。他正在对那一页进行正则化。这让人想起了早期停止和套索算法:任何没有出现在页面上的东西都不能帮助他做出决定。
1700496350
1700496351
当达尔文下定决心要结婚时,他立即开始思考时间的问题。“什么时候结婚?马上还是再等等?他在另一份关于利弊的清单上列出了他的愿望:从幸福的考虑到某些“奇怪”的开支,再到他长期以来想乘坐热气球和去威尔士旅行。但在这一页的最后,他下定决心“不要在意,相信运气”。结果,在几个月的时间里,他向艾玛·韦奇伍德求婚,这是一段美好的关系和幸福家庭生活的开始。
1700496352
1700496353
1700496354
1700496355
1700496357
算法之美:指导工作与生活的算法 08 松弛 顺其自然
1700496358
1700496359
2010年,梅根·贝洛斯正在普林斯顿大学攻读化学工程博士学位,她的研究围绕着如何将氨基酸放入蛋白质链中,以产生具有特殊特征的分子。(“如果你能最大限度地发挥两种蛋白质的结合能,就能成功地设计出一种生物功能的多肽抑制剂,这样你就能真正抑制疾病的进展。”)当时她也在为自己的婚礼做准备。在婚礼前,她为安排座位而苦恼。
1700496360
1700496361
现在已经有9个大学朋友坐在一起,贝洛斯正在发愁再让谁加入才能让这样一个小小的团体凑够10个人一桌。更糟糕的是,她数了数发现自己有11位亲戚。将谁从尊敬的父母席上分出去呢,她又该怎么向他们解释呢?还有像她的童年邻居和保姆,或者她父母的同事,他们在婚礼上根本不认识什么人怎么办?
1700496362
1700496363
这个问题似乎和她在实验室里研究的蛋白质问题一样困难,她被问题打败了。一天晚上,当她盯着座位图时,“我意识到我博士论文中的氨基酸和蛋白质跟我的婚礼上人们的座位之间确实存在着一对一的关系。”贝洛斯向她的未婚夫喊了一声,便开始写方程式。氨基酸变成了客人,结合能变成了相互关系,而分子之间所谓的“紧邻相互作用”就是邻近的相互作用。她可以利用自己研究中的算法来安排自己的婚礼。
1700496364
1700496365
贝洛斯想出一个用数字来定义所有宾客之间关系的方法。如果某个人不认识另一个人,他们会得到0分,如果他们认识,会得到1分,如果他们是夫妻,会得到50分。(新娘的妹妹给所有想坐在一起的人打10分,作为一种特殊的特权。)然后,贝洛斯指定了一些约束条件:例如最大桌容量和每桌的最低分值,这样就不会有一桌变成“混杂”组,坐的都是陌生人。她还整理了这个项目的目标:最大限度地提高每桌客人之间关系的得分。
1700496366
1700496367
婚礼上有107人,11张桌子,每张可容纳10人。这意味着大约有11107种可能的座位安排:这是一个112位的数字,是一个大于2000亿的天文数字,这个数字在可观测的宇宙中可使原子(仅仅80位数)数目相形见绌。在周六晚上,贝洛斯把这份工作提交到她的实验室电脑里进行处理。当她周一早上来上班的时候,它还在分析。她把迄今为止找到的最好的结果提取出来,然后把它放回到蛋白质设计上。
1700496368
1700496369
即使有一个高性能的实验室计算机集群和整整36小时的处理时间,这个程序也无法评估潜在座位安排的极小部分。可能性是真正能获得最高分的最佳解决方案,从来没有出现在它的排列中。不过,贝洛斯对计算机的分析结果感到满意。“它识别出我们已经遗忘的关系。”她说。计算机提供了令人愉快的、非传统的可能性,人类计划者甚至从来没有考虑过。例如,它提议将她的父母从家庭餐桌上“删除”,以他们多年未见的老朋友代之。计算机的最终建议是一项各方都同意的安排,尽管新娘的母亲忍不住做了一些人为调整。
1700496370
1700496371
就连普林斯顿实验室的总计算能力都无法找到完美的座位分配计划,这一点似乎令人十分惊讶。在我们讨论过的大多数领域中,直接的算法可以保证最佳的解决方案。但是,正如计算机科学家在过去几十年里所发现的那样,无论我们的计算机处理速度有多快,我们如何巧妙地对它们进行编程,一个问题的完美解决方案都是不存在的。事实上,没有人能像计算机科学家那样理解,在面对看似无法控制的挑战时,你既不应该永远辛苦工作,也不应该放弃,但我们将会看到第三种尝试。
1700496372
1700496373
1700496374
1700496375
1700496377
算法之美:指导工作与生活的算法 最优化的难度
1700496378
1700496379
美国内战之前,亚伯拉罕·林肯在起草《解放奴隶宣言》或发表葛底斯堡演说之前,在伊利诺伊州的斯普林菲尔德当过一段时间的“草原律师”,他每年都要去第八巡回审判庭两次,这样坚持了16年。作为一名巡回律师,这意味着要在14个不同郡县的城镇里进行巡回审理,在数周内要骑行数百英里。规划这些线路带来了一个自然的挑战:如何在尽可能少的英里数内到达所有要去的城镇,而不重复经过任何一个城镇。
[
上一页 ]
[ :1.70049633e+09 ]
[
下一页 ]