1702628796
在商业领域的市场调查中,经常会聘请社会调查专家进行协助。当然,那种只会用随意制作的调查表和Excel进行统计的所谓市场调查专家,完全不在我们的讨论范围之内。
1702628797
1702628798
希望进行调查的公司会首先计算出预计的误差,然后委托调查公司提交一个调查方法,使其能够在预算范围内得到最准确的必要信息。最后,他们就会得出“什么样的顾客有多少人”或者“这些顾客在我的商场平均消费额是多少”之类的估计值和误差范围。根据统计的结果来指定经营战略,相信是很多热衷于市场调查的企业经常采用的方法。
1702628799
1702628800
追求“适当判断”的流行病学家和生物统计学家
1702628801
1702628802
虽然我们无法否定这种调查的重要性,但是从另一个角度来说,即使我们已经清楚地掌握了顾客人数和市场规模,最后还是要靠企业领导们的感觉来决定“最后采取何种经营战略”就太浪费了。
1702628803
1702628804
在这种时候最好能够进行随机对照试验,或者利用回归模型和倾向指数也能够推测出因果关系。只要搞清楚改变什么因素,能够对追求的结果(在商业领域一般都是和利益有直接联系的指标)产生影响,那么能够控制这个因素的战略就是最正确的。
1702628805
1702628806
费希尔在英国的洛桑实验室发明了随机对照试验,戈赛特受进化论的影响发明了回归模型。虽然他们的专业领域被定义为生物统计学,但实际上他们的发明并不只局限于生物领域,而几乎能够在所有领域中作为统计学方法的基础。顺便说一下,因为我的统计学专业是流行病学和生物统计学,所以本书中所讲述的内容也稍微偏重于这两个方面。
1702628807
1702628808
之前我曾经说过,实际上几乎所有的科学家都引用过费希尔的《试验设计》这本书。书中提到的随机对照试验,不仅可以应用在包括农业在内的生物学之中,其他像工学与化学等以物体为对象的领域,甚至心理学、教育学以及最近的政策科学和经营学等以人类为对象的领域,它都能够在其中发挥巨大作用。而且,以除了人类之外的生物和物体为对象,更加容易进行随机对照试验。
1702628809
1702628810
在由于伦理或感情无法进行随机化的以人类为对象的领域,可以使用流行病学的方法论。这种方法同样可以应用在教育、政策以及经营等许多领域。
1702628811
1702628812
这两者共同的思考方法,都是为了寻找对最终结果产生影响最大的“原因”。反过来说,只要找到了基于p值的“原因”,甚至连估计值的“国民适应性”这一社会调查领域的统计学家们最重视的要素,都显得不那么重要了。
1702628813
1702628814
比如说,吸烟是否影响身体健康,流行病学家和生物统计学家最关心的是准确无误的结论,至于吸烟会缩短寿命8年或10年,对他们来说并不是那么重要。另外,如果老人吸烟会缩短寿命10年,年轻人吸烟会缩短寿命15年的话,还要考虑交互作用的问题,因为如果“只限定在年轻人的范围内”就有可能出现“吸烟延长寿命”这一完全颠覆结论的交互作用结果。但不管怎样,既然吸烟对健康有非常不好的影响,那么首先降低吸烟率才是正确的选择。只要能够做出这样的判断,在某种程度上也算是令人满意的结果了。
1702628815
1702628816
因此,生物统计学家和流行病学家,并不十分拘泥于“全国的随机样本”。如果出现极端的数据偏差,比如想要对全体国民的因果关系进行讨论时,结果却只收集到了医生的数据,或者只收集到了高中生的数据,即便在这种情况下,也只是加上“此结果是以偏向于医生群体的数据计算得来”这样的注释后正常发表。
1702628817
1702628818
另外,在一篇内容严谨的论文中一定还会有类似这样的说明,“是否适用于其他群体尚不明确,应用时需要注意”,或者“今后还将继续研究其他群体是否具有相同的关联性”。
1702628819
1702628820
在流行病学和生物统计学中,要想从全体数据中获得充分的随机样本,必须花费大量的成本和时间。由于这一现实条件的制约,所以才诞生了上述思考方法。
1702628821
1702628822
假设现在日本出现了死亡率为50%的可怕传染病,并且已经造成3万人死亡。此时,必须立即通过流行病学的方法找出死亡的原因。但是,感染人数和死亡人数尚且不足日本人口总数的0.1%。也就是说,从日本全体国民中随机选出1万人,只能从中找出几个感染者,而且其中的一半人还因为死亡而无法进行调查。这样的话完全无法进行任何分析。
1702628823
1702628824
那么,我们可以只以感染者作为对象进行抽样调查。可是,这需要我们拥有全部感染者的名单,否则也无法进行抽样调查。在这种情况下最好的选择是,首先对眼前的感染者数据进行全面分析,也就是前面提到过的思考方法。
1702628825
1702628826
统计学家们永无休止的争论
1702628827
1702628828
所以,流行病学家和生物统计学家们,相比“通过抽样调查得到的正确估计值”更加重视“通过随机化做出的适当判断”。而那些接受以社会调查为中心的统计学教育的人(或者说对统计学一知半解的人),常常会提出“没有随机抽样调查的结果都不准确”,结果双方就会陷入永无休止的争论中。场面大概会像下面这样。
1702628829
1702628830
“没有对全体国民进行随机抽样调查,所以你的结论不准确。”
1702628831
1702628832
“虽然分析的只是年轻人的数据,但是只要年龄与吸烟的危害之间没有太强的交互作用,吸烟对身体有害的这个结论是不会改变的。”
1702628833
1702628834
“可是,交互作用究竟是否存在,我们并不能够确定啊。”
1702628835
1702628836
“那么,你说老人吸烟对身体有益的说法有什么证据吗?”
1702628837
1702628838
“没有,可这并不能证明吸烟一定对身体有害。”
1702628839
1702628840
“所以,我说了这次的研究主要偏向年轻人群体的数据,今后还将对其他年龄段进行研究。”
1702628841
1702628842
“那你为什么凭借这个片面的结果就确定了吸烟有害呢?”
1702628843
1702628844
“所以,我不是说过,只要年龄与吸烟的危害之间没有太强的交互作用,吸烟对身体有害的这个结论就不会改变的吗?”
1702628845
[
上一页 ]
[ :1.702628796e+09 ]
[
下一页 ]