1702641185
20.0≤18岁以下人口比例<21.0
1702641186
1702641187
21.0≤18岁以下人口比例<22.0
1702641188
1702641189
·
1702641190
1702641191
·
1702641192
1702641193
·
1702641194
1702641195
31.0≤18岁以下人口比例<32.0
1702641196
1702641197
确保每个数字都落在其中一个区间内,某个州的18岁以下人口的比例为20.9%,应该落在第一个区间内,人口比例为21.0%则落在第二个区间内。
1702641198
1702641199
第二步:记录落在每个区间内的数字的数量。比如,在第一个区间内有两个,第二个区间内有三个,等等。
1702641200
1702641201
第三步:画直方图。在横轴上标示出你要展示的变量区间,这里是“18岁以下人口的百分比”,刻度是从20到32,因为这个区间涵盖了所有数据。纵轴是计数,每个柱形代表一个区间,柱形的底部就是所在区间的位置,柱高就是计数。除非有一个区间为空(柱形高度为零),否则柱形与柱形之间不能有空隙,下图就是我们画的直方图。
1702641202
1702641203
1702641204
1702641205
1702641206
11.2 这个分布基本上是对称的(有点儿右偏),中心接近于2%。数据(忽略异常值)分布大约在1.2%到3.0%之间。有一个异常值(位于柱状图的最左侧)。
1702641207
1702641208
第12章
1702641209
1702641210
1702641211
12.1 有22个观察值,中位数在最中间的两个数(第11个和第12个)之间,这两个数是35和41,所以中位数是。
1702641212
1702641213
中位数的左边有11个观察值,第一四分位数是这11个数字的中位数,即Q1=11;第三四分位数是中位数右边11个观察值的中位数,即Q3=47。
1702641214
1702641215
12.2 下面是鲁斯全垒打数据的箱形图:
1702641216
1702641217
1702641218
1702641219
1702641220
鲁斯的中位数(38)和第三四分位数(47)要比邦兹和艾伦的略大,因此鲁斯的分布看上去要比邦兹和艾伦的更偏斜(左偏)。看鲁斯的职业生涯,就会发现他在头6个赛季中是投球手,那段时间他的表现并不理想。所以,他有6个赛季的全垒打数量很少,从而形成了一个左偏分布。
1702641221
1702641222
12.3 平均数是:
1702641223
1702641224
1702641225
1702641226
1702641227
计算标准差,用下表:
1702641228
1702641229
1702641230
1702641231
1702641232
方差是:
1702641233
1702641234
[
上一页 ]
[ :1.702641185e+09 ]
[
下一页 ]