1702627110
穿孔卡片上记录的数据可以非常简单地记录在只读光盘(CD–ROM)或者硬盘上,数据输入也可以看着画面非常简单地进行。获得的数据可以通过互联网非常方便地收集和传送,至于统计分析,不仅可以通过个人电脑来进行,甚至连现在的智能手机都能够胜任。
1702627111
1702627112
以前的统计学家们常用的研究方法有两种,或者省去计算的麻烦直接进行类似的准确度较高的推测,或者尽可能少地对数据进行计算并得出准确度较高的推测,但是这些研究方法现在基本上已经不会出现在实际分析当中。随着计算机技术的进步,不管是庞大的数据还是繁杂的计算,都已经不再是统计分析的瓶颈。
1702627113
1702627114
另外,以前的统计学教育只能依靠黑板和粉笔,或者纸和笔,主要以理解算式,对几十个数据进行手工计算和分析为主。但是,现在的统计分析只需要写一个简单的程序,或者使用现成的统计分析工具,对大规模的数据进行实际分析也成为可能。
1702627115
1702627116
虽然我们现在主要使用的统计学思考方法和分析方法,早在几十年前就已经基本完成,但是像现在这样让每个人都能够随时随地地简单使用,还是在20世纪末计算机技术发生革命性进步之后,才得以实现的。
1702627117
1702627118
以前的纸和笔的统计学与现代的计算机统计学之间存在着巨大的差距,现代的统计学家必须在精通数理知识的同时,还掌握计算机技术的应用。
1702627119
1702627120
如果本书的读者朋友们在大学时代对统计学课程留下了一种无聊的印象,那么可能是因为只接受过“纸和笔的统计学”教育,所以对于一直在时代最前沿给出最佳解答的计算机统计学的力量没有切身感受,这也是情有可原的。
1702627121
1702627122
“大数据”时代浓浓的统计学气息
1702627123
1702627124
统计学在近几年的变化,可以说受计算机的影响最为强烈。
1702627125
1702627126
计算机使商业模式发生了翻天覆地的变化。商品的采购、库存、销售等记录基本上全都已经数据化,成本和销量的把控与用纸笔进行管理的时代相比也变得更加简单。顾客资料与消费记录、工作人员的工作时间与评定、健康状态、支付的报酬与成本核算等信息,都可以存储在公司内部系统和Excel电子表格中。为了生产而进行的机械操作、到自己公司网站的链接,基本上所有的登录情况都会被记录下来,必要时可以综合统计作为经营的参考。就算说那些大型公司几乎所有的业务流程已经全部实现电子化,也不为过。
1702627127
1702627128
但是,当一系列的业务都实现计算机化之后,那些从事计算机业务的企业却遭遇了瓶颈。不管他们如何提高硬件和软件的处理性能,如果需要计算机化的业务流程没有增加,顾客对性能没有特别需求,那么他们就无法继续销售自己的商品。所以,不管是硬件厂商还是软件厂商,还是使用这些提供计算机服务的厂商,所有与计算机相关的企业,都必须对已经得到满足的顾客们,提供一个购买他们更新技术的“理由”。
1702627129
1702627130
从好的方面来看,要想将已经足以满足顾客需要的性能更好地加以利用,就要考虑“如何创造更多的价值”。而实际上,计算机企业所考虑的是向顾客传达“为了找出创造更多价值的方法,必须进行大量的数据处理”,为了让顾客接受这一提议,必须有一个“明显对商业有价值的理由”。
1702627131
1702627132
以现在的计算机技术来看,不管是多么庞大的数据量或者多么繁杂的计算都能够胜任,因此需要考虑的问题就变成了应该针对什么进行计算,而答案除了统计分析之外再无其他。当然,如果只是将“统计分析”这个简单的词语作为题目,会让人感觉缺乏吸引力,于是就诞生出“大数据”和“商务智能”的概念。现在大家之所以都对这两个题目和统计学如此关注,恐怕就是出于上述原因。
1702627133
1702627134
计算机行业的业界巨人,在弗明汉研究使用穿孔卡片和大型计算机时代就为其提供技术支持的IBM公司在这一点上表现得最为突出。IBM斥资数十亿美元收购了在商务智能方面非常有名的Cognos公司,以及开发统计分析软件的SPSS公司,这两家公司都是在这一领域拥有丰富经验和影响力的公司。据说2005~2011年之间,IBM公司对统计学和商务智能相关企业的投资金额已经超过140亿美元。
1702627135
1702627136
除了IBM之外,微软公司以及在数据库领域非常有名的甲骨文公司,还有NTT数据公司,都开始积极地收购与统计学和商务智能相关的企业。
1702627137
1702627138
或许这几家公司都已经发现,在接下来的时间里从自己的商业领域产生价值的主营产业,都在其中。
1702627139
1702627140
最能够证明这一推测的根据,来自于微软在专门用于招聘的网页上于2010年8月23日发表的一篇文章,其中提到技术领域今后最热门的3个专业,如下所示。
1702627141
1702627142
数据分析、机械学习、人工智能、自然语言处理。
1702627143
1702627144
商务智能、竞争分析。
1702627145
1702627146
分析、统计——特别是网页分析、分离测试(A/B测试)、统计分析。
1702627147
1702627148
只要是学过“计算机统计学”知识的人,都能够从上述内容里感觉到浓浓的统计学气息吧。
1702627149
1702627150
为了再现人类的认知机能,而从计算程序算法研究发展而来的机械学习与人工智能领域,如今若是没有统计学的理论基础就很难深入学习,至于商务智能则完全可以说是统计学在商业领域的应用。要想完成A/B测试的计划,20世纪中叶现代统计学之父罗纳德·艾尔默·费希尔所完成的被称为“试验设计”的统计学相关知识,则是最为重要的基础。
1702627151
1702627152
未来10年最受欢迎的职业是统计
1702627153
1702627154
另外,谷歌(Google)则比微软更加明确地表达了对统计学家的赞誉。谷歌的首席经济学家哈尔·范里安博士曾经在2009年1月麦肯锡公司发行的杂志上这样说道:
1702627155
1702627156
我一直坚信,未来10年最受欢迎的职业是统计。
1702627157
1702627158
最近,美国人经常使用“sexy”这个词来表达“受欢迎的”或者“有魅力的”,比如,“新款苹果手机的设计非常sexy”。哈尔认为统计学家也是“sexy”的。
1702627159
[
上一页 ]
[ :1.70262711e+09 ]
[
下一页 ]