打字猴:1.701778634e+09
1701778634
1701778635 对于社会阶层这个因素来说,以上逻辑同样有效。在其他因素相同的前提下,一个人所处的社会阶层越低,他吸烟的可能性越大;一个人所处的社会阶层越低,则他患心血管疾病的风险越高,同时这不受其他风险因素支配,比如吸烟。对于肥胖这个因素也是同理。这些同吸烟和患心血管疾病的概率都有关联的变量需要剔除出去,这样才能看到吸烟和患心血管疾病之间的真正联系。
1701778636
1701778637 多元回归分析背后的原理是,如果你控制了一切与自变量和因变量都有关系的因素,将它们从交错的混合影响中抽离,那么你就能得到预测变量与结果变量之间真正的因果关系。实际上,会有许多因素妨碍这一理想分析状态实现。
1701778638
1701778639 首先,我们如何能确定我们辨认出了所有可能的混淆变量——那些与自变量与因变量皆有关的变量?我们几乎不可能宣称认清了所有变量。我们只能测量那些我们认为可能重要的变量,并且不考虑无穷多的我们认为不重要的变量。然而“假设可能是错的”随时存在。因此这场战役通常会输掉。
1701778640
1701778641 其次,我们如何正确地测量每个可能的混淆变量?如果我们对一个变量测量得不准确,那么我们对它的控制就达不到要求。如果我们对一个变量测量得太糟糕以至没有任何效度,那么我们就无法控制任何变量。
1701778642
1701778643 有时候,对于测量一些有趣和重要的问题,多元回归分析是唯一可用的研究工具。比如说,宗教信仰和实践是否与较高或较低的生育率有关。我们无法进行一个实验来检验这个问题,无法随机分配人们去信仰什么或是不信仰什么。我们只能利用像多元回归分析这样的检验相关性的方法。实际上,宗教因素和生育率是有关联的,不论是在个人层面上,还是在国家和文化层面上。将收入、年龄、健康状况等个人因素控制起来,将所属族群这个因素控制起来,将国家这个因素控制住,那么宗教信仰越深,则生育率越高。然而,可能只是因为我们不知道,宗教信仰和生育率之间的因果联系可能并不存在,实际上是有未知的第三变量对两者皆有影响。因果关系甚至有可能体现在相反方向上:有了太多的孩子可能会让人们去寻求宗教支持和指引!不过,相关性的发现很有意思,知道这些便可能得出一些真实世界中的推论。
1701778644
1701778645 我很清楚,并不是所有相关性研究或者多元回归分析都是没有价值的。我自己经常使用多元回归分析法,即使是在我用实验探索因果关系的时候。如果我知道有一种特定的事物间的关联存在于生活中,而不只是存在于实验室中或是某种非典型的生态环境中时,我会十分开心。
1701778646
1701778647 另外,我们总能聪明地让我们确认自己发现了一些因果关系。国家的富裕和国民的智商水平之间的联系,这里的因果联系是怎样的?这种联系本身充满争议。很多事情都和二者皆有关联,比如身体健康。“健康,富裕和睿智”并不仅仅是种表述,这三者之间关联极深,而其中又涉及许多潜在的因果变量。并且,国富与民智之间的因果联系可以从两个方向上来看。如果国民更聪明,那国家也更富有,这是因为有更多先进和复杂的方式可以采用,让生活变得更加容易。如果一个国家更富裕,那它的国民更聪明,因为财富通常可以提升教育质量。
1701778648
1701778649 但是,有时候我们也会看到一种被称作“滞后相关”的因果关系,即一个自变量(假定的原因)与另一个变量(假定的结果)的关系会在一段时间之后体现。例如,如果一个人因为教育水平提高而变得更聪明,那么他在将来的某个时候会更富有吗?的确会更富有。几十年前,爱尔兰在提升其教育体系上获得了综合性的高度成功,尤其是成功提高了高中、职业学校和大学的教学水平。大学入学率在较短时间内就提升了50%。经过30年的发展,那个曾经国民智商测验得分远低于英国的爱尔兰(据英国的一些心理学家称,这是基因导致的)的人均国内生产总值竟然超出了英国。芬兰同样从几十年前开始努力,显著提升了国民的受教育水平。芬兰主要的关注点在于保证那些最贫穷的孩子也能获得和最富有的孩子一样的受教育机会。到2010年,芬兰人在国际学术成就测验中取得的成绩超过其他任何国家的人,其个人平均收入取得了极大增长,一举超过日本和英国,紧随美国居次。那些在近些年中没有在教育提升方面取得长足进展的国家则在国民人均收入上有所跌落,比如美国。这样的数据之间仍存在相关性,而它们表明当一个国家开始打破其教育方面的困局时,它就会变得更富裕。当一个国家在教育方面停滞不前时,与其他保持进步的国家相比,它会失去其财富。这一点相当有说服力。
1701778650
1701778651 许多其他情境也可以极大地提升相关性研究的说服力,使其几乎可以与自然实验,甚至是与随机控制实验的说服力相比肩。例如,纯粹对于效果的度量有时候会让我们感到这肯定不仅仅是人为控制的,而是存在相关变量。我们有时候也会对一种情况表现出确信无疑的态度,即如果效果是有“剂量依赖性”的,那么产生这种效果的特定治疗方法便是真实的。换句话说,使用某种治疗方法的频率越高,则效果显示得越明显。比如,那些一天抽两包烟的人比一天吸一包烟的人更有可能在心血管方面出现问题。这更容易让人们相信,吸烟真的会让心血管的健康状况恶化,而其实单纯的吸烟数量与发病率并无关联。
1701778652
1701778653 然而,因为多元回归分析常被采用,所以关于它确实存在一些严重的问题。我必须要明确指出这些问题,因为媒体总在持续报道基于错误方法而得出的研究结论,而一些重要的政府决策就是基于这些报道而来。流行病学家、疾病研究者、社会学家、心理学家和经济学家都会用到多元回归的工具。它会引发严重的错误,而这种方法的拥护者宣告他们发现了所谓的因果关系其实是虚假的。
1701778654
1701778655 在许多情况下,多元回归分析向人们揭示了某种因果关系,而真正的随机控制实验给出了另外的结论。在这种情形下,我们应当相信实验的结果。
1701778656
1701778657 你会认为一个班级中孩子的数量对孩子们的学习成绩有影响吗?看上去似乎是有影响的。然而,有许多备受尊敬的调查学者进行的大量多元回归分析告诉我们,去除学区里的孩子所在家庭的平均收入、学校规模、孩子在智商测验中的表现、城市规模和地理位置这些因素,班级的学生数量与学生的成绩并没有关联。推论是:我们现在知道了并不需要浪费钱缩小班级的规模。
1701778658
1701778659 然而,田纳西州的科学家针对班级规模进行了一次随机实验。通过掷硬币,研究者将幼儿园三个年级的孩子随机分配在小班(13~17人)或大班(22~25人)中。这个研究发现小班中的孩子在标准化考试中的成绩提高了0.22个标准差;而且少数族裔孩子的成绩提升效果比白人孩子更明显。另外还有三个关于缩小班级规模对孩子成绩影响的实验,这些实验的结果几乎都和田纳西州的实验相同。这四个实验并不只是关于班级规模和学生成绩关系的附加实验。它们替代了所有有关班级规模的多元回归分析。这是因为对于这类问题,我们会更信赖实验的结果。
1701778660
1701778661 为什么通过多元回归分析会得出班级规模不重要的结论呢?我也不知道。但是,我们也不必非要知道一个有关班级规模是否重要的强力观点。
1701778662
1701778663 当然,这四个实验也留下了许多悬而未决的问题。我们并不知道对于一个国家的不同地区、城市化程度不同的地域、不同的社会阶层而言,班级的规模是否重要。我们不知道那些产生了不同教学效果的班级究竟发生了什么。这些问题的答案可以通过进一步实验来寻找。而对于每个应用不同于现在已有方式来检验不同人群的实验来说,如果有了积极发现,那么我们会更加确信规模大的班级更有利于学生提升成绩。
1701778664
1701778665 缩小班级规模是否是进行教育投资的最佳着力点则是另一个问题,寻找这个问题的答案需要的成本不低。芬兰并没有特别的小型班级,最终教学水平提高更多地是因为向教师支付了更高的薪酬,并且主要从大学班级最优秀的学生中挑选教师,就像美国现在做的一样。不过,无论在什么情况下,一个国家都不可能只根据一个X因素给Y因素带来了有益影响就制定出一个政策。在政策出台过程中,还是需要完备的成本–收益分析的。
1701778666
1701778667 那些基于多元回归分析或相似分析方法的相关性研究所存在的问题是,它们明显会受到自我选择的错误影响。各类样本——人、班级或农田——有着千百种不同。长期吸烟者并不只是吸烟的时间久,他们还会被各种与吸烟有关的因素影响,比如更大的年龄、更低的社会阶层和肥胖。A班的教室比B班的大,然而可能仍然存在一些研究者无法控制的其他变量。A班可能有一位更好的老师,这是因为校长认为可以管理好大班的老师更优秀。B班的学生可能有更好的学业成绩,即便它比A班的学生多,因为校长认为更多有能力的学生在一起会不易受到外界因素干扰。这样看来,并不能通过简单地增加教室或控制变量来解决问题。
1701778668
1701778669 在那些样本是在实验情境下随机分配的研究中,教室存在的多样性在其他层面上也会存在。然而,重要的是,实验中是由研究者选定具体条件的。这意味着,平均而言,实验教室和控制教室有着同样好的老师,同样有能力和积极主动的学生,同样的资源。这些教室并不是自己“选择”了它们所属的水平,而是研究者选定的。那这两类教室唯一的区别就在于相关变量了,即班级的规模。那么,像这样基于班级规模的实验便不会得出确定性的结论。教师和管理者在此不是双盲的。他们知道每个班级的规模,这可能会影响他们的教学方式,包括他们对工作投入多大的精力。这就是那些涉及自我选择的问题中的缺陷。
1701778670
1701778671 医学乱象
1701778672
1701778673 你是否知道摄入大量橄榄油可以让你中风的概率下降41%?你是否知道如果你患上了白内障并对其进行手术,则在未来15年中你的死亡率会比未进行手术的人低40%?你知道耳聋会导致痴呆吗?你知道怀疑他人会导致痴呆吗?
1701778674
1701778675 如果你对上述说法感到怀疑,那是很自然的。然而,这类所谓的发现不断出现在媒体的报道中。它们通常是基于流行病学研究而得出的结果。(流行病学是针对患病群体类型和病因的研究。)大量的流行病学研究都是依赖多元回归分析而进行的。流行病学家们通过多元回归分析“控制”诸如社会阶层、年龄和病人曾经的健康状况等因素。可是,他们无法避免自我选择带来的问题。有条件采取特定治疗方法的只是一类人,能消费大量特定食品的只是一类人,能摄取特定维生素的也只是一类人。这些人跟没有条件做这些事的人有着诸多不同。
1701778676
1701778677 让我们来看那项声称摄入更多橄榄油能降低中风概率的研究,在此研究中剔除的控制因素包括“社会经济背景、体育运动、身高体重指数、中风的风险因素”。那些“频繁”摄入橄榄油的人比从不食用橄榄油的人中风的概率降低了41%。然而,可能并不是摄入橄榄油本身这件事降低了中风概率,而是某种和消费橄榄油相关的事造成的影响。比如说,种族的原因。意大利裔美国人是消费橄榄油的一大群体,而非洲裔美国人则几乎不会消费橄榄油。意大利裔美国人的预期寿命比黑人要长得多,而黑人则刚好更容易中风。
1701778678
1701778679 在流行病学研究中最大的潜在“捣乱分子”通常是社会阶层。如果不是其他大多数医学方面的原因的话,阶层应该是最明显的造成不同人群中风概率不同的因素了。富人和我们不同。他们有更多的钱。更有钱的人便能消费得起橄榄油,而不是玉米油。更有钱的人会有条件进行更广泛的阅读,与他人交流阅读体会,从而相信橄榄油比其他油类更健康。更有钱的人能享受更好的医疗服务。更有钱的人——那些处于更高社会阶层的人,无论是通过教育水平、个人收入,还是职业声望来衡量都会享有更好的生活。
1701778680
1701778681 在流行病学研究中控制不了社会阶层因素而带来一个后果是无法找到一种特定疾病的病因。假设研究者尝试控制社会阶层变量,那么该如何操作呢?有些人使用的收入指标,有些人用的教育水平,有些人用的职业声望。哪一种最好?还是说你最好把三者结合起来?真实的研究中其实会使用其中一种,或者都用,或者另择其他变量。这样做的结果就是媒体上各种“医学发现”让你感到混乱迷茫。(油脂对你无益。不,油脂有益。红肉好。不,红肉不好。抗组胺剂可以有效减轻一般感冒。不,抗组胺剂没什么用。)产生这些不同的结论就是因为研究者采取了不同的方法去定义社会阶层,或者甚至是根本没有考虑这个因素。
1701778682
1701778683 然而,社会阶层只是大量潜藏于多元回归分析研究中的干扰因素之一。几乎所有在此类研究中与预测变量和结果变量都相关的因素最终都能用来解释那两个变量的关联。
[ 上一页 ]  [ :1.701778634e+09 ]  [ 下一页 ]