打字猴:1.7010243e+09

1701024300

1701024301

1701024302

1701024303 其中最有名的是费马于1637年提出的猜想，该猜想断言方程式在A、B、C、n为正整数且n大于2时无解。（如果n等于2，该方程式会有很多根，例如：。）

1701024304

1701024305 当时，大家都坚信费马猜想是正确的，就像我们现在相信孪生素数猜想一样。但是，没有人知道如何证明费马猜想，一直到20世纪90年代，普林斯顿大学的数学家安德鲁·怀尔斯才取得了突破。我们认为，n次完全幂已经非常稀少了，要在极为稀少的随机数集中找到两个数字，使两者的n次幂和等于第三个数字的n次幂，这样的可能性更是接近于零。大多数人甚至认为，广义的费马方程式Ap+Bq=Cr在指数p、q与r足够大时也是无解的。如果在p、q、r都大于3且A、B、C没有相同质因数（素因数）的条件下，有人能证明上述方程无解，达拉斯的一位名叫安德鲁·比尔（Andrew Beal）的银行家就会奖励这个人100万美元。我完全相信这个命题是真的，我的理由是：如果完全幂是随机数，这个命题就应该是真命题。但是我认为，要想完成这个命题的证明，我们还必须了解关于数字的一些全新发现。我与多名合作者一起，花了好几年的时间，证明在p=4、q=2、r>4的条件下广义的费马方程式无解。为了解决这个问题，我们专门设计了一些新方法。很显然，仅凭这些并不足以完成这个价值百万美元的任务。

1701024306

1701024307 尽管有界距离猜想看上去非常简单，但是张益唐的证明却需要运用现代数学的一些非常深奥的定理。张益唐在前辈的研究基础上完成了他的证明：用我们前面提到的第一种方法，即考察多个素数除以3所得余数的情况，可以看出素数具有随机数的特征。他证明了素数的随机性具有完全不同的意义，与相互间距离的大小有某种关系。随机数就是随机数！

1701024308

1701024309 张益唐的成功，以及当代其他数学家（比如本·格林与陶哲轩）所完成的相关研究，都表明我们最终会建立内容更丰富的随机理论，这样的前景甚至比任何单个的研究成果更加令人兴奋。比如，在我们认为数字表现出杂乱无序的随机性分布特征时，我们有某种方法精确地定义这个说法，尽管这种方法的根源是一些实实在在的数论程序。帮助我们彻底揭开素数所有秘密的有可能是一些新的数学理念，而这些理念又赋予了杂乱无序这个概念新的内涵，这样的前景似乎自相矛盾，却又令人无比陶醉！

1701024310

1701024311 [1]有的人坚持应对这种方法加以区分：如果得出自相矛盾的结果，该证明方法就是反证法；如果仅仅得出错误的结果，这种证明方法就是“拒取式论证法”（modus tollens）。

1701024312

1701024313 [2]根据有效的经验法则，你可以推断出，在样本中寻找白化病人时，每名实验对象可以贡献1/20 000的可能性，因此50名对象总的贡献为1/400。这种算法不完全正确，但是在结果非常接近于零（例如本例）的情况下，它通常足够精准。

1701024314

1701024315 [3]读到这里大家就能看懂logN的真正定义了。所谓对数，就是使ex=N等式成立的数字x。这里，e是欧拉数，它的值约等于2.718 28……。这里我使用了“e”，而不是“10”，因为我们准备讨论的对数是自然对数，而不是常用对数（即以10为底的对数）。如果你是一位数学专业人士，或者你有e手指，你就会经常使用自然对数。

1701024316

1701024317 [4]基布兹是希伯来语“团体”的意思。——译者注

1701024318

1701024319

1701024320

1701024321

1701024322 魔鬼数学：大数据时代，数学思维的力量 [:1701022624]

1701024323 魔鬼数学：大数据时代，数学思维的力量第9章肠卜术与科学研究

1701024324

1701024325 统计学家科斯马·沙利兹（Cosma Shalizi）曾经给我讲过一个寓言故事：

1701024326

1701024327 假设你是一位肠卜僧，也就是说，你的工作是杀死绵羊，通过研究绵羊的内脏（尤其是肝脏）特征预测未来。当然，你不会因为自己在完成相关仪式时遵循了伊斯特里亚诸神的神谕，就认为自己的预测十分可靠。你还需要找到相关证据，于是，你和你的同事将预测结果提交给《国际肠卜术杂志》（International Journal of Haruspicy），请同行评议，该杂志要求所有预测结果都必须通过显著性检验才能发表。

1701024328

1701024329 肠卜僧做预测，尤其是严格基于证据的预测，并不是一件简简单单的差事。一方面，你经常会全身沾满污血；另一方面，你的很多次预测都不会成功。你尝试通过研究绵羊的内脏来预测苹果公司的股价，结果失败了；你试图为民主党在西班牙裔美国人当中的投票支持率构建预测模型，结果没有成功；你预测全球石油的供应情况，也失败了。吹毛求疵的诸神，有时并不明示哪种内脏结构以及哪些咒语可以准确地预测未来。有时候，多位肠卜僧所做的实验是一模一样的，但是A成功了，B却失败了。这样的情况令人沮丧，有时候你甚至想放弃做肠卜僧，转而去读法学院。

1701024330

1701024331 但有时候一切又非常顺利，你发现绵羊肝脏的纹路与凸起部位真的可以预测第二年流感爆发的严重程度。这些发现让你觉得自己没有白白地遭遇那些挫折与失败，于是，你默默地感谢神灵，然后把预测结果发表到杂志上。

1701024332

1701024333 你可能会发现，每进行大约20次实验，就会有一次预测是正确的。

1701024334

1701024335 至少我觉得预测正确的概率就这么大。因为我不会像你一样相信肠卜术，我觉得绵羊的内脏不会知道流感爆发的日期，即使两者正好吻合，也纯属巧合。换句话说，只要涉及通过绵羊内脏来预测未来，我都认为零假设是正确的。因此，根据我的经验，肠卜术实验取得成功的可能性非常小。

1701024336

1701024337 这种可能性到底有多小呢？按照惯例，统计学显著性检验的标准临界值（p值）也是《国际肠卜术杂志》同意发表预测结果的标准临界值，都是0.05或1/20。别忘了，p值的定义明确规定，如果某个实验的零假设为真，即使该实验真的取得了具有统计学显著性的结果，其成功的概率也仅为1/20。如果零假设总是正确，也就是说，如果肠卜术纯粹是一种骗人的把戏，那么在20次实验中，只有一次实验的结果能达到发表的标准。

1701024338

1701024339 然而，肠卜僧有成百上千个，被开膛破肚的绵羊为数更多，因此，即使预测成功的概率仅为1/20，这些成功的实验也能提供大量的证明材料，各种不寻常的实验结果也足以填满每期杂志的版面，让人们相信肠卜术是有效的，神的智慧是不容怀疑的。但是，即使某个实验真的预测成功并且获准发表，如果其他肠卜僧尝试做该实验，也通常会遭遇失败。不过，由于在预测结果不具有统计学显著性时，实验结果不会获准发表，因此人们无法通过重复实验去验证它。而且，即使有人发出质疑的声音，专家们也总能指出重复实验过程中的细微差别，作为跟踪研究失败的借口。他们的理由是：我们确信这个实验是有效的，因为我们进行并通过了统计学显著性检验。

1701024340

1701024341 现代医学与社会科学不是肠卜术，但是近些年来，一些唱反调的科学家不断发出越来越大的声音，向我们传递一个令人不安的信息：在科学界，可能还有更多“肠卜术”，只不过我们不愿意承认罢了。

1701024342

1701024343 发出最大声音的是希腊人约翰·约安尼迪斯（John Ioannidis）。2005年，这位由中学数学明星蜕变而成的生物研究人员，发表了一篇题为“公开发表的研究成果大多不真实的原因何在”的论文，在临床医学领域引发了一场自我批评的狂风暴雨（随之而来的是一波自我辩解的风潮）。有时，作者为了哗众取宠，往往在论文标题中危言耸听，但这篇论文不属于此列。约安尼迪斯严肃地指出，医学研究和肠卜术一样，找不到任何有实际效果的内容，所有的专科就是一个个“毫无内涵的领域”。他认为：“我们可以证明，得到发表的医学研究成果大多是不真实的。”

1701024344

1701024345 约安尼迪斯肯定不愿意大费周折地完成这种“证明”工作，但是这位数学家的确有充分的理由，认为他的这个反传统声明并不是无理取闹。约安尼迪斯认为，我们在医学上尝试使用的介入治疗法大多不会起作用，我们所检测的各种关系大多是子虚乌有。以基因与疾病之间的关系为例。基因序列中有大量基因，其中绝大多数都不会引发癌症、抑郁症或肥胖症等，至少人们没有直接观察到基因会导致人们患此类病症。约安尼迪斯请大家考虑基因对精神分裂症的影响，由于这种疾病有遗传的可能，人们几乎可以肯定是基因在起作用。但是，起作用的基因位于基因序列的什么位置呢？研究人员可能会普遍撒网（毕竟，我们所处的是一个大数据时代），对10万种基因（更精确的名词是“遗传性多态现象”）进行检验，以期找出与精神分裂症有关的基因。约安尼迪斯指出，在这些基因中，大约有10种真的会对精神分裂症产生影响。

1701024346

1701024347 那么，其余的99 990种基因呢？这些基因与精神分裂症没有任何关系。但是，其中的1/20或者说5 000种基因，会顺利通过统计学显著性检验。换句话说，在人们欢呼“天啊，我发现了精神分裂症基因”时，在这些可能获准发表的研究结果中，虚假结果的数量是真实结果的500倍。

1701024348

1701024349 而且，要得到上述结果，我们还得假定所有真的对精神分裂症有影响的基因顺利通过检验。从前文讨论的莎士比亚与篮球的例子可以看出，如果研究方法的功效不足，真实结果就完全有可能被认定为不具有统计学显著性而被排除在外。如果研究功效不足，真正会产生影响的基因可能会有半数顺利通过显著性检测，也就是说，在所有通过检验的导致精神分裂症的那些基因中，只有5种基因会真正致病，而浑水摸鱼、仅凭运气顺利通过检验的基因却有5 000种那么多。

[ 上一页 ] [ :1.7010243e+09 ] [ 下一页 ]