1700433430
1700433431
统计显著性经常被用于求平均值和百分比,它常用来对统计模型的参数进行估计。统计显著性测试是非常有价值的,它会确保数据没有欺骗你。你可以从数学角度来查看区别是否足够大,以及区别是否有价值,有时候看起来是重要的差异其实并不重要,而看起来不重要的差异却会有重大的意义。一个统计测试将确保结论的正确性。
1700433432
1700433433
关于测试有一整套的方法论。商业世界中常见的术语是测试和研究。测试和研究只是大学统计课程中的基本实验设计概念。在测试和研究环境中设计实验的目的是评估一个或多个选项的效果,并确定哪一种选项的可能性最大。
1700433434
1700433435
业务人员需要确保遵循正确的方法进行决策,而不是简单地使用那些“明显的”答案。有一个完全违反直觉的例子,也是我最喜欢的例子,是关于某大学的球员评估问题。请看一下表7-2,有两个一起玩了5个赛季的棒球球员,从表7-2中可以看到,在5个赛季的每次比赛中,乔的平均击球率都高于汤姆。假如我们有一个非常简单的问题:“在这五个赛季中,谁的平均击球率更高?”请读者花一点时间思考,并确定你的答案。
1700433436
1700433437
表7-2 赛季中棒球的平均击球率
1700433438
1700433439
1700433440
1700433441
1700433442
答案是……这也许会让你感到惊讶:我们不知道谁拥有最好的总体平均击球率!因为在表7.2中没有足够的信息推测出所有5个赛季中谁的平均击球率更高。
1700433443
1700433444
这怎么可能?如果我们知道在每个赛季中,乔和汤姆有相同数量的击球数,那么答案就像看起来的那样简单,乔将是赢家。但是假如他们的击球数不同呢?在乔和汤姆都有各自最好的平均击球率的赛季,假如乔受伤了几个月,只有很少的击球数,结果又如何呢?类似地,如果汤姆受伤,在本赛季中有最低的击球率,因此乔有更多的击球数,结果又如何呢?即使汤姆每个赛季的击球率都较低,整体上他也可以有比乔更高的击球率!这可能不常见,但这完全有可能出现。
1700433445
1700433446
永远不要走捷径
1700433447
1700433448
当你只知道故事的一部分,你得到的结论可能是完全错误的。所以永远不要采取简单的分析就认定结果是确实可信的,还坚持没必要进行任何形式的统计显著性测试。因此,要始终确保你拥有所需的全部数据,在得出结论之前,还要对这些数据做各种测试。
1700433449
1700433450
不知道击球数,就不可能确定总体上谁做得更好。看一下表7-3的示例,汤姆是如何在5年的整体评估中成为赢家的。在这项总体评估中,基于t检验,汤姆和乔在击球平均数方面的区别没有足够的统计显著性。所以,我们发现实际上是汤姆赢了乔,而表面上看起来是乔击败了汤姆。请注意,这个结论并不是那么简单的,虽然汤姆赢了,但是他的领先优势并不显著。这些分析都与统计学相关,因此分析所得结论的差别也更加细微。
1700433451
1700433452
表7-3 平均击球率的总体比较
1700433453
1700433454
1700433455
1700433456
1700433457
*汤姆获胜,但领先的幅度并不显著。从统计学的角度看,汤姆和乔的成绩是相关联的。
1700433458
1700433459
大多数人会看表格7-2的数据,却不愿费心去深入思考这个问题,他们只能得到表面上显而易见的答案:乔有一个更好的整体平均击球率。请不要这么做,一定要确保你做了测试和验证。
1700433460
1700433461
最后一点和统计显著性相关的是,当人们通过统计试验,确定自己的结论有95%或99%的准确性时,大多数人会感到非常惬意,时刻谨记的是,你是正确的概率是95%,但仍然有5%的概率你会出错。这意味着,你每重复执行20次,都会出现1次错误。
1700433462
1700433463
要确保结论的准确性水平与相应决策的风险程度挂钩。例如,假设企业会因为这个错误的决定而彻底破产,那么95%的准确性水平可能是不够的,也许99.9%或更高的准确性才是你的目标。
1700433464
1700433465
假如大量重复,至少出现1次错误的概率就会变大。你必须准备好分析这些错误并从中进行学习。或者,你需要把统计显著性设置的非常非常高来保持非常非常低的风险。对新药的临床试验来说,准确性门槛就非常高,因为一个糟糕药品的影响非常巨大,甚至包括死亡。而一个公司决定在剩下时间里应该把图像A还是图像B放在某个网页的顶部,这个统计显著性的门槛就非常低了。
1700433466
1700433468
7.6.2 业务重要程度
1700433469
1700433470
我们讲过了统计显著性的含义,以及获取完整数据并进行正确测试的必要性,因为没有人可以100%地肯定决定是正确的。这不是分析工作的结束,最后一步是评估统计显著性发现的业务重要程度。
1700433471
1700433472
让我们假设统计建立在分析的基础上。这里还有一项同等重要甚至更加重要的工作,即提出正确的问题。这项统计分析的结果很好,但是这对于业务来说重要吗?业务人员是如何利用对统计分析结果并采取相应措施的呢?我们发现了一个影响因素,但是它造成了足够大的、有意义的影响吗?
1700433473
1700433474
请务必将分析结果放到业务环境下进行最终的验证分析。可能你有99%的信心,将某次促销方案的客户响应率至少提升10%,这很棒!但是如果这个促销方案的成本是原来方案的2倍怎么办?在这种情况下,取得额外10%的响应率不能够弥补额外的成本支出。在这个场景下,回报率的高低并不重要,至少从业务的角度来说是如此。
1700433475
1700433476
从一个更宏观的角度来看待统计显著性。哪些成本与前面提到的业务建议相关?在一段时间内这个建议可以带来多少收入?这个方案是否与公司的长远战略保持一致?是否有足够的人员和时间来实施这项方案?统计显著性是非常重要的,但只有与业务关注点结合起来,它才会变得有价值。
1700433477
1700433478
一个出色的分析能带来价值,而不是干扰
1700433479
[
上一页 ]
[ :1.70043343e+09 ]
[
下一页 ]