1702632770
预测有效性
1702632771
1702632772
如果某一个指标的量度,可以用来预测跟这个指标有关的一些事情,我们就认为其具有预测有效性(predictive validity)。
1702632773
1702632774
从统计学的角度来看,预测有效性是最明确而且最有用的一种有效性。“美国学术能力评估测试分数是否有助于预测大学成绩”这个问题,要比“IQ测试是不是可以测量智力水平”明确多了。然而,预测有效性可不是“是或否”的概念。我们应该问,用美国学术能力评估测试分数来预测大学成绩的准确程度如何?我们还应该问,美国学术能力评估测试对哪些群体具有预测有效性?比如,它预测男生的大学成绩很准,对女生却不准。有统计学方法可以描述“准确程度”。
1702632775
1702632776
准确和不准确量度
1702632777
1702632778
用家用体重秤来量你的体重是有效的。可是,如果你的体重秤跟我的体重秤一样,量出来的体重就不见得准了。来看一下我的体重秤,它可以量我的体重,但量出来的并不是我的真实体重。我的体重秤总会量多3磅,所以读数是:
1702632779
1702632780
量出来的体重=真实体重+3磅
1702632781
1702632782
如果事实果真如此,那么对于同一个人的体重,体重秤显示的数字应该相同。但是,大部分体重秤都会有少许变化,你离开体重秤然后马上又站上去,体重秤的读数也不见得一样。我的体重秤用久了,不灵敏了,因为指针没有真正归零再加上不稳定,它总会多量3磅。今天早上我的体重秤有点儿不灵敏,读数又少了1磅。所以读数是:
1702632783
1702632784
量出来的体重=真实体重+3磅–1磅
1702632785
1702632786
我从体重秤上下来然后马上再站上去的时候,体重秤的读数比平常又多了1磅。这一次的读数是:
1702632787
1702632788
量出来的体重=真实体重+3磅+1磅
1702632789
1702632790
我不喜欢看到这一次量出的体重比前一次更重,所以就走下体重秤,马上再站上去量了一次。这次体重秤又向另一个方向偏移了,得到的读数是:
1702632791
1702632792
量出来的体重=真实体重+3磅–1.5磅
1702632793
1702632794
如果我闲得没事干,一直在体重秤上上上下下,就会得到各种不同的读数,读数会以超过真实体重3磅为中心点上下浮动。
1702632795
1702632796
我的体重秤有两种误差。如果没有其他的意外情况,读数总是会多出3磅,不管谁站上去都是这样。我们把这种每次度量时都会出现的系统性误差叫作偏差。我的体重秤偶尔会出现一点儿小状况,但是读数会改变多少,每次有人站上这台体重秤时都不一样。读数有时会增多,有时又会减少。结果就是,体重秤平均来说会多量出3磅,但反复称量一个人时,读数却会上下变动。这种因意外状况而产生的误差,我们根本无法预测,所以它被称为“随机误差”(random error)。
1702632797
1702632798
度量时的误差
1702632799
1702632800
我们可以这样来看度量时产生的误差:度量出来的值=真实值+偏差+随机误差
1702632801
1702632802
度量过程如果每次都测量出比真实值大的值,或者比真实值小的值,就叫作偏差。
1702632803
1702632804
度量过程如果在反复度量同一个事物时,每次的值都不同,就叫作随机误差。若随机误差很小,我们就称测量值是可靠的。
1702632805
1702632806
为了确定随机误差是否很小,我们可以使用一个叫作“方差”(variance)的变量。将某一个体n次的测量值按以下方法计算,即可得到方差。
1702632807
1702632808
1.计算n个测量值的平均值。
1702632809
1702632810
2.计算每个测量值与平均值的差,再计算其平方值。
1702632811
1702632812
3.将得到的平方值加总,再除以n–1,就得到了方差。
1702632813
1702632814
一个可靠的度量过程应该方差值较小。
1702632815
1702632816
对于在这台旧体重秤量出的3个测量值,假设你的真实体重是130磅,那么这3个测量值是:
1702632817
1702632818
130+3–1=132磅
1702632819
[
上一页 ]
[ :1.70263277e+09 ]
[
下一页 ]