打字猴:1.700498071e+09
1700498071 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497482]
1700498072 数据挖掘与数据化运营实战:思路、方法、技巧与应用 1.4 数据化运营的必要条件
1700498073
1700498074 虽然从上面的分析可以看出,数据化运营有如此多的优越性,但并不是每个企业都可以采取这种新战略和新管理制度,也不是每个企业都可以从中受益。个中原因在于成功的数据化运营必须依赖几个重要的前提条件。
1700498075
1700498076 数据挖掘与数据化运营实战:思路、方法、技巧与应用 [:1700497483]
1700498077 1.4.1 企业级海量数据存储的实现[1]
1700498078
1700498079 21世纪核心的竞争就是数据的竞争,2012年3月29日,美国奥巴马政府正式宣布了“大数据的研究和发展计划”(Big Data Research and Development Initiative),该计划旨在通过提高我们从大型复杂数据集中提取知识和观点的能力,承诺帮助加快在科学和工程中探索发现的步伐,加强国家安全。从国家到企业,数据就是生产力。但是,具体到某一个企业,海量数据的存储是必须要面对的第一个挑战。数据存储技术的飞速发展,需要企业与时俱进。根据预测到2020年,全球以电子形式存储的数据量将达到35ZB,是2009年全球存储量的40倍。而在2010年年底,根据IDC的统计,全球数据量已经达到了1 200 000PB或1.2ZB。如果将这些数据都刻录在DVD上,那么光把这些DVD盘片堆叠起来就可以从地球到月球打一个来回(单程约24万英里,即386 242.56千米)。海量的数据推动了数据存储技术的不断发展与飞跃。
1700498080
1700498081 我们一起来回顾一下数据存储技术的发展历程:
1700498082
1700498083 1951年:Univac系统使用磁带和穿孔卡片作为数据存储。
1700498084
1700498085 1956年:IBM公司在其Model 305 RAMAC中第一次引入了磁盘驱动器。
1700498086
1700498087 1961年:美国通用电气公司(General Electric)的Charles Bachman开发了第一个数据库管理系统——IDS。
1700498088
1700498089 1969年:E.F.Codd发明了关系数据库。
1700498090
1700498091 1973年:由John J.Cullinane领导的Cullinane公司开发了IDMS——一个针对IBM主机的基于网络模型的数据库。
1700498092
1700498093 1976年:Honeywell公司推出了Multics Relational Data Store——第一个商用关系数据库产品。
1700498094
1700498095 1979年:Oracle公司引入了第一个商用SQL关系数据库管理系统。
1700498096
1700498097 1983年:IBM推出了DB2数据库产品。
1700498098
1700498099 1985年:为Procter&Gamble系统设计的第一个商务智能系统产生。
1700498100
1700498101 1991年:W.H.BillInmon发表了文章《构建数据仓库》。
1700498102
1700498103 2012年:最新的存储技术为分布式数据仓库、海量数据存储技术和流计算的实时数据仓库技术。
1700498104
1700498105 回首中国企业的数据存储之路,国内的数据存储技术的发展经历了将近30年,而真正的飞速发展则是最近10年。
1700498106
1700498107 国内的数据存储的先驱是国有银行,在21世纪初,四大国有银行的全国数据中心项目(将分布在全国各个省行和直属一级分行的数据集中到数据中心)拉开了数据技术飞速发展的帷幕。
1700498108
1700498109 以发展最具代表性的中国工商银行为例,中国工商银行从2001年开始启动数据集中项目,刚开始考虑集中中国北部的数据到北京,中国南部的数据到上海,最终在2004年将全部数据集中到了上海,而北京则作为灾备中心,海外数据中心则安置在深圳。中国工商银行的数据量在当时是全中国最大的,大约每天的数据量都在TB级别。由于银行业存在一定的特殊性(性能要求低于安全和稳定要求),又因为当时业内可选的技术不多,因此中国工商银行选择了大型机+DB2的技术方案,实际上就是以关系型数据库作为数据存储的核心。
1700498110
1700498111 在3年的数据集中和后续5年基于主题模型(NCR金融模型)的数据仓库建设期间,中国工商银行无论在硬件网络和软件人力上都投入了巨大的资源,其数据仓库也终于成为中国第一个真正意义上的企业级数据中心和数据仓库。
1700498112
1700498113 其他银行和证券保险,甚至电信行业以及房地产行业的数据仓库建设,基本上也都是采用与工商银行相似的思路和做法在进行。
1700498114
1700498115 不过,随着时间的推移,数据量变得越来越大,硬件的更新换代也越来越快,于是,这类数据仓库逐渐显现出了问题,主要表现如下:
1700498116
1700498117 ❑少数几台大型机已经无法满足日益增加的日终计算任务的执行需求,导致很多数据结果为T-2(当天数据要延后2天才完成),甚至是T-3(当天数据要延后3天才完成)。
1700498118
1700498119 ❑硬件升级和存储升级的成本非常昂贵,维护、系统开发以及数据开发的人力资源开支也逐年加大。
1700498120
[ 上一页 ]  [ :1.700498071e+09 ]  [ 下一页 ]