1702629290
1702629291
不过,针对最终的经济损失数据,还必须满足“回归系数在考虑性别与年龄的基础上对其他群体也适用”和“癌症患者的医疗费今后不发生变化”这样的假设条件。
1702629292
1702629293
流行病学家和生物统计学家在利用归纳的方法导出一般规律的时候,会认为“因为没有进行随机对照试验,所以肯定会包含误差,换作其他群体的话或许无法与这个回归系数保持一致”,对涉及普遍性的部分保持比较谦虚的态度。甚至被某些计量经济学家们说成是“胆小鬼”。因此,他们“只在这次的调查对象”范围进行准确无误的因果推论,并且在加上“应用于其他对象群体时请注意”这样的说明后才提交结果。只要他们能够准确地推论出自己感兴趣的原因与结果的关系性,那么对于包括性别和年龄等其他变量的模型是否适用于日本民众就不那么关心了。
1702629294
1702629295
但是,对于计量经济学家们来说,无法作为演绎对象的模型对于经济学的进步来说没有任何意义,因此他们比其他统计学家们更加热衷于利用一切手段去寻找最合适的、最准确的模型。利用抽样调查对社会调查数据进行分析就是他们的方法之一。如果能够获得更好的模型,就能够降低在今后的演绎中出现错误结论的可能性。但是,不管模型有多么完美,他们仍然对类似神经元网络那样的联立方程式一样的表现形式没有任何兴趣。
1702629296
1702629297
另外,我在赫克曼的疗效模型和倾向指数之间也发现了“为了进行演绎的模型”与“为了对导致因果关系出现误差的原因进行调整的模型”这种思想上的区别。
1702629298
1702629299
使用倾向指数进行的分析与随机对照试验一样,属于“除了感兴趣的因素之外其他条件基本相同”的情况。将这样的倾向指数应用在回归模型之中,就能够准确分析多个解释变量对结果变量所造成的影响。哈佛大学的教授鲁宾等人在1994年发表的论文对此有巨大的影响。但是,赫克曼在20世纪70年代就已经提出了回归分析的方法,后人也不断对其进行细节方法上的改善。
1702629300
1702629301
但实际上,并不像有些刻薄的计量经济学家们所说的“统计学家与经济学家相比研究的级别要落后20年”。在流行病学家和生物统计学家看来,在倾向指数实现的分组分析中,能够像随机对照试验那样“平均情况下其他条件基本相同”的话,就足以用来进行因果推论了。但是,对于计量经济学家来说,“公平比较”本身并不是目的,只不过是为了得到更加准确的演绎模型的一种手段罢了。
1702629302
1702629303
影响力不断增强的计量经济学
1702629304
1702629305
几乎所有的统计学家都希望能够尽可能地减少假设。因为一旦假设错误,因果推论的结果出现错误的可能性就会非常大。
1702629306
1702629307
但是另一方面,如果假设在某种程度上是正确的,那么通过演绎就能够得到比数据更多的信息。况且,统计学本身也不是在没有任何假设的前提下就一定准确的东西。
1702629308
1702629309
不管是计量经济学还是统计学,最关键的都不是推论出来的结果,而是其背后隐藏着怎样的假设,以及假设有多少准确性。只要能够理解这两点,那么在推论过程中使用哪种方法,不过就是琐碎的小事。
1702629310
1702629311
这个在演绎与归纳或者说在理论与实证之间扮演着重要角色的计量经济学,实际上是在最近一段时间才在经济学中占有一席之地的。经济学领域最有影响力的约翰·梅纳德·凯恩斯将利用统计学手法的计量经济学称为“黑魔法一样奇怪的东西”,经济学中也将计量经济学褒贬不一地称为“没有理论的测量”。因为对经济学来说理论是非常重要的,由此可见计量经济学的特立独行。
1702629312
1702629313
正如统计学是“最强的学问”一样,计量经济学在数据整理和计算机的发展方面也发挥着举足轻重的作用。恐怕在今后的日子里,经济学的诸多理论都会被计量经济学证明,我们的社会也将会变得更加富强。
1702629314
1702629316
29 贝叶斯派与频率派之间的对立
1702629317
1702629318
1702629319
1702629320
在这一章中,我已经对统计学在社会调查、心理统计学、数据挖掘与计量经济学等各种各样的领域中的思考方法进行了介绍,最后让我们对“围绕概率本身的思考方法”出现的对立进行一下介绍。
1702629321
1702629322
这就是频率派与贝叶斯派之间的对立。如果将两者之间的区别用一句话来概括的话,那就是“是否在事前预测某种概率”。
1702629323
1702629324
为了理解两者之间的区别,让我们假设有两种硬币。一种是出现正面和出现背面的概率都是50%的“真正的硬币”,另一种是出现正面的概率是80%、出现背面的概率是20%的“老千硬币”。我们假设这两种硬币的外形和重量完全相同,然后各投掷一定的次数,对出现的结果进行统计和分析,判断究竟是哪一种硬币。
1702629325
1702629326
频率派的思考方式很简单
1702629327
1702629328
频率派就是基于费希尔那种思考方式的统计学家。如果投掷10次全都出现正面的话,那么这枚硬币究竟是真正的硬币还是“老千硬币”呢?频率派首先会假设“这枚硬币是真的”,然后根据这个假设计算投掷10次全部正面朝上的概率。“在正面朝上的概率达50%的条件下,偶然10次全部出现正面朝上的概率是2的10次方分之一,也就是只有0.10%。”这和前文中出现的那个妇人“猜对全部10杯奶茶的概率”是一样的,这个0.10%的概率也被称为p值。那么相比这个堪称奇迹的概率,否定“这枚硬币是真的”的假设才是比较理智的判断吧。
1702629329
1702629330
接下来,假设“这枚硬币是老千硬币”,进行与之前同样的计算。“正面朝上的概率达80%的条件下,偶然10次全部出现正面的概率是10.74%”。p值为10.74%的话,就算不上是奇迹了。所以,这个假设是可以成立的。
1702629331
1702629332
既然“这枚硬币是真的”的假设不成立,而“这枚硬币是老千硬币”的假设成立,那么就可以认为这枚硬币是“老千硬币”了吧。更简单地说,只要将这枚硬币投掷1 0000次,然后计算其出现了多少次正面朝上的情况即可。大概真正的硬币出现正面朝上的次数约为5 000次,而“老千硬币”出现正面的次数约为8 000次。所谓频率派,就是指在“无数次的试验”中出现结果的“频率”。而且,在这种情况下真正的硬币出现正面朝上次数为8 000次的p值和“老千硬币”出现正面朝上次数为5 000次的p值都非常低。
1702629333
1702629334
贝叶斯派的“事前概率”与“事后概率”
1702629335
1702629336
贝叶斯派在对这枚硬币进行判断的时候,首先会在没有任何信息的时候考虑这枚硬币有多大的概率是真硬币或“老千硬币”。这种概率被称为事前概率。事前概率的数值是多少都无所谓,暂时假设概率为50%。然后根据和之前相同的“10次投掷全部出现正面朝上”这一结果进行推测。
1702629337
1702629338
前半部分的计算过程和结果与频率派完全一样,最后都是0.10%和10.47%,但接下来的结算方法就有所不同了。
1702629339
[
上一页 ]
[ :1.70262929e+09 ]
[
下一页 ]