打字猴:1.702628796e+09

1702628796 在商业领域的市场调查中，经常会聘请社会调查专家进行协助。当然，那种只会用随意制作的调查表和Excel进行统计的所谓市场调查专家，完全不在我们的讨论范围之内。

1702628797

1702628798 希望进行调查的公司会首先计算出预计的误差，然后委托调查公司提交一个调查方法，使其能够在预算范围内得到最准确的必要信息。最后，他们就会得出“什么样的顾客有多少人”或者“这些顾客在我的商场平均消费额是多少”之类的估计值和误差范围。根据统计的结果来指定经营战略，相信是很多热衷于市场调查的企业经常采用的方法。

1702628799

1702628800 追求“适当判断”的流行病学家和生物统计学家

1702628801

1702628802 虽然我们无法否定这种调查的重要性，但是从另一个角度来说，即使我们已经清楚地掌握了顾客人数和市场规模，最后还是要靠企业领导们的感觉来决定“最后采取何种经营战略”就太浪费了。

1702628803

1702628804 在这种时候最好能够进行随机对照试验，或者利用回归模型和倾向指数也能够推测出因果关系。只要搞清楚改变什么因素，能够对追求的结果（在商业领域一般都是和利益有直接联系的指标）产生影响，那么能够控制这个因素的战略就是最正确的。

1702628805

1702628806 费希尔在英国的洛桑实验室发明了随机对照试验，戈赛特受进化论的影响发明了回归模型。虽然他们的专业领域被定义为生物统计学，但实际上他们的发明并不只局限于生物领域，而几乎能够在所有领域中作为统计学方法的基础。顺便说一下，因为我的统计学专业是流行病学和生物统计学，所以本书中所讲述的内容也稍微偏重于这两个方面。

1702628807

1702628808 之前我曾经说过，实际上几乎所有的科学家都引用过费希尔的《试验设计》这本书。书中提到的随机对照试验，不仅可以应用在包括农业在内的生物学之中，其他像工学与化学等以物体为对象的领域，甚至心理学、教育学以及最近的政策科学和经营学等以人类为对象的领域，它都能够在其中发挥巨大作用。而且，以除了人类之外的生物和物体为对象，更加容易进行随机对照试验。

1702628809

1702628810 在由于伦理或感情无法进行随机化的以人类为对象的领域，可以使用流行病学的方法论。这种方法同样可以应用在教育、政策以及经营等许多领域。

1702628811

1702628812 这两者共同的思考方法，都是为了寻找对最终结果产生影响最大的“原因”。反过来说，只要找到了基于p值的“原因”，甚至连估计值的“国民适应性”这一社会调查领域的统计学家们最重视的要素，都显得不那么重要了。

1702628813

1702628814 比如说，吸烟是否影响身体健康，流行病学家和生物统计学家最关心的是准确无误的结论，至于吸烟会缩短寿命8年或10年，对他们来说并不是那么重要。另外，如果老人吸烟会缩短寿命10年，年轻人吸烟会缩短寿命15年的话，还要考虑交互作用的问题，因为如果“只限定在年轻人的范围内”就有可能出现“吸烟延长寿命”这一完全颠覆结论的交互作用结果。但不管怎样，既然吸烟对健康有非常不好的影响，那么首先降低吸烟率才是正确的选择。只要能够做出这样的判断，在某种程度上也算是令人满意的结果了。

1702628815

1702628816 因此，生物统计学家和流行病学家，并不十分拘泥于“全国的随机样本”。如果出现极端的数据偏差，比如想要对全体国民的因果关系进行讨论时，结果却只收集到了医生的数据，或者只收集到了高中生的数据，即便在这种情况下，也只是加上“此结果是以偏向于医生群体的数据计算得来”这样的注释后正常发表。

1702628817

1702628818 另外，在一篇内容严谨的论文中一定还会有类似这样的说明，“是否适用于其他群体尚不明确，应用时需要注意”，或者“今后还将继续研究其他群体是否具有相同的关联性”。

1702628819

1702628820 在流行病学和生物统计学中，要想从全体数据中获得充分的随机样本，必须花费大量的成本和时间。由于这一现实条件的制约，所以才诞生了上述思考方法。

1702628821

1702628822 假设现在日本出现了死亡率为50%的可怕传染病，并且已经造成3万人死亡。此时，必须立即通过流行病学的方法找出死亡的原因。但是，感染人数和死亡人数尚且不足日本人口总数的0.1%。也就是说，从日本全体国民中随机选出1万人，只能从中找出几个感染者，而且其中的一半人还因为死亡而无法进行调查。这样的话完全无法进行任何分析。

1702628823

1702628824 那么，我们可以只以感染者作为对象进行抽样调查。可是，这需要我们拥有全部感染者的名单，否则也无法进行抽样调查。在这种情况下最好的选择是，首先对眼前的感染者数据进行全面分析，也就是前面提到过的思考方法。

1702628825

1702628826 统计学家们永无休止的争论

1702628827

1702628828 所以，流行病学家和生物统计学家们，相比“通过抽样调查得到的正确估计值”更加重视“通过随机化做出的适当判断”。而那些接受以社会调查为中心的统计学教育的人（或者说对统计学一知半解的人），常常会提出“没有随机抽样调查的结果都不准确”，结果双方就会陷入永无休止的争论中。场面大概会像下面这样。

1702628829

1702628830 “没有对全体国民进行随机抽样调查，所以你的结论不准确。”

1702628831

1702628832 “虽然分析的只是年轻人的数据，但是只要年龄与吸烟的危害之间没有太强的交互作用，吸烟对身体有害的这个结论是不会改变的。”

1702628833

1702628834 “可是，交互作用究竟是否存在，我们并不能够确定啊。”

1702628835

1702628836 “那么，你说老人吸烟对身体有益的说法有什么证据吗？”

1702628837

1702628838 “没有，可这并不能证明吸烟一定对身体有害。”

1702628839

1702628840 “所以，我说了这次的研究主要偏向年轻人群体的数据，今后还将对其他年龄段进行研究。”

1702628841

1702628842 “那你为什么凭借这个片面的结果就确定了吸烟有害呢？”

1702628843

1702628844 “所以，我不是说过，只要年龄与吸烟的危害之间没有太强的交互作用，吸烟对身体有害的这个结论就不会改变的吗？”

1702628845

[ 上一页 ] [ :1.702628796e+09 ] [ 下一页 ]