打字猴:1.70263367e+09
1702633670 统计学的世界(第8版) [:1702629681]
1702633671 统计学的世界(第8版) 第2部分 整合数据
1702633672
1702633673
1702633674 仅靠文字本身不能构成故事,得由作者把文字组成句子,再把句子编成故事。如果文字组合得不好,故事可能让人看不大懂。数据也一样,要让人看清楚数字隐含的信息,同样需要经过整合。文字写得太唆,会让主题变模糊而不是变清楚。罗列一大堆数据更是叫人难以消化,因此我们常常需要一个言之有物的概要,来凸显重要的内容。应该如何整理、综合与呈现数据,就是本书第二部分的主题。
1702633675
1702633676 在整理与综合大量的事实时,最容易扭曲事实,其中有些是无心的,有些却是故意的。不管呈现事实用的是数字还是文字,上述情况发生的概率都差不多。我们将指出,在呈现数据时会让不小心的人上当的一些陷阱。把统计数据看成说谎工具的人,看统计报告时会把注意力都放在数据综述和展示上。我们却主张,误导性的综述和选择性的展示早在偷食禁果的亚当、夏娃跟上帝的对话中就已出现了。不要怪统计数据,老话说:“数字不会说谎,但说谎的人会算计。”所以,要小心。
1702633677
1702633678
1702633679
1702633680
1702633681 统计学的世界(第8版) [:1702629682]
1702633682 统计学的世界(第8版) 第10章 好图表与坏图表
1702633683
1702633684 案例分析
1702633685
1702633686 美国人的阅读量在减少,而且阅读技能在衰退。“每日阅读的习惯,与更好的阅读技巧和更好的学业表现高度相关。”美国国家艺术基金会的一份报告如是说。这份报告中有一幅图,见图10–1。它夹杂在其他图表中,试图让美国人相信他们的阅读能力在衰退。图中显示的趋势确实是下降的,我们应该担心这个问题吗?
1702633687
1702633688 统计学被用于处理数据,图表则被用来展示数据。图表可以帮助我们看清楚数据在说什么,但并非所有图表都能做到这一点。在这一章,我们将学习一些展示数据的基本方法,以及如何评估你在媒体上接触到的图表的质量。在本章最后,你将学会评估图10–1是一幅好的图表还是坏的图表。
1702633689
1702633690
1702633691
1702633692
1702633693 图10–1 2007年11月美国国家艺术基金会的阅读调查报告中的一幅图
1702633694
1702633695 数据表
1702633696
1702633697 建议你翻看一下《美国统计摘要》,它每年出版一本,里面有各式各样的数字信息。私立小学和中学的数目是不是有所增长?在这些学校的学生中,弱势群体占多大比例?在过去几年中,每年平均有多少人得到学士学位?这些学位若根据学习领域来分,或者根据获得者的年龄、种族或者性别来分,各占多大比例?所有这些以及更多其他信息都可以在《美国统计摘要》的“教育”那一节里找到。这些数据表(Data table)对统计数据做了摘要。我们并不想要有关每一个大学学位的信息,只想知道我们感兴趣的那些数字。
1702633698
1702633699 例1 什么样的图表才算清楚?
1702633700
1702633701 成年人的受教育程度如何?表10–1展示了25岁及以上成年人的数据。这个表是数据图表的一个好的示范,表的标示很清楚,数据的主题一目了然。主标题描述了数据的主题,并且列出了年份,因为这种数据会逐年改变。表里面的项目简单说明了变量,以及变量的单位,例如,人数以千人为单位。数据来源出现在表的底部。这份人口普查局发布的结果,事实上是从“当前人口调查”中得到的。
1702633702
1702633703 表10–1 25岁及以上成年人的受教育程度,2009年
1702633704
1702633705
1702633706
1702633707
1702633708 资料来源:人口普查局,《2009年美国教育实况》
1702633709
1702633710 表10–1先列出了25岁及以上受教育程度不同的人的数量。比率(或者百分比)通常要比计数清楚,比如,有13.3%的这个年龄段的人没有读完高中,比有26415000个人没有读完高中,传递的信息要清楚得多。表10–1中也列出了百分比,表里面的这两列数字,用两种不同方式呈现了受教育程度这个变量的“分布”(distribution)情况。每一行提供的信息,包括变量的值,以及这个变量所占的比率。
1702633711
1702633712 变量的分布
1702633713
1702633714 一个变量的分布,可以告诉我们变量有些什么可能的值,以及每一个值所占的比率。
1702633715
1702633716 例2 舍入误差
1702633717
1702633718 你有没有检查一下表10–1中的数字是否相符?总人数应该是:
1702633719
[ 上一页 ]  [ :1.70263367e+09 ]  [ 下一页 ]