打字猴:1.703952408e+09
1703952408 技术管理之巅:如何从零打造高质效互联网技术团队? [:1703949773]
1703952409 技术管理之巅:如何从零打造高质效互联网技术团队? 9.2 最接地气的基础架构设计
1703952410
1703952411 技术管理之巅:如何从零打造高质效互联网技术团队? [:1703949774]
1703952412 9.2.1 大数据平台架构设计
1703952413
1703952414 上一节,我们学习了最接地气的应用架构设计,在学习过程中你已经发现了,里面用到了许多基础架构框架,如服务治理平台、分布式文件存储、大数据平台等。本节我们一起来探讨这些最接地气、最实用的基础架构,首先介绍的是大数据平台的架构设计。
1703952415
1703952416 近年来,大家对大数据的关注度和使用频率越来越高,软件产品中的各类数据都被记录下来,以便更好地研究和分析。在电商企业中,每天系统记录下来的运营数据,达到几百GB增量的规模,为了保证所有数据能集中存储并且可随时访问,越来越多的企业把离线数据体系从商用的Exadata等解决方案,全面转向开放的Hadoop体系当中,以谋求成本与扩展性的平衡。
1703952417
1703952418 有一定技术实力的互联网公司,纷纷搭建自己的大数据平台,如图9-9所示是一个典型的大数据平台的技术架构,下面我们一起来学习。从图9-9可以看到,大数据平台是由数据存储、数据同步分发、监控、离线计算、平台安全、资源申请等部分构成的。
1703952419
1703952420
1703952421
1703952422
1703952423 图9-9 大数据平台技术架构
1703952424
1703952425 数据存储,是整个大数据平台的基础,包含如:HDFS、HBase、Hive、MapReduce、Storm等等。下面,我们对其中的主要框架做些介绍,详细资料大家可以到搜索引擎中获取。
1703952426
1703952427 HDFS,分布式文件系统,Hadoop的核心组成部分。
1703952428
1703952429 MapReduce,分布式数据处理,Hadoop核心之一。
1703952430
1703952431 HBase,一个分布式的,列存储数据库,使用HDFS作为底层存储,同时支持MapReduce的批量式计算和点查询。
1703952432
1703952433 Zookeeper,一个分布式的,高可用的协调服务。提供分布式锁之类的基本服务,用于构建分布式应用。
1703952434
1703952435 Hive,分布式数据仓库,Hive管理HDFS中存储的数据,并提供基于SQL的查询语言用以查询数据。
1703952436
1703952437 Hama,建立在Hadoop上的分布式并行计算框架,基于Map/Reduce和Bulk Synchronous的实现框架,运行环境需要关联Zookeeper、HBase、HDFS组件。
1703952438
1703952439 Mahout,一个基于MapReduce的机器学习算法库,运行在Hadoop集群上。
1703952440
1703952441 Cassandra,一种混合的非关系型数据库,类似于Google的BigTable。
1703952442
1703952443 以上就是数据存储层中,用到的一些开源数据框架,我们继续看大数据平台的其他组成部分。
1703952444
1703952445 数据同步分发,这个组件对数据同步和分发做统一管理,可实现异步、分布式的数据同步和分发。
1703952446
1703952447 监控,指的是对大数据平台的服务和资源,进行监控和预警,包括数据存储的可用性、性能、系统负载、资源请求的响应时效等。
1703952448
1703952449 离线计算,处理离线计算任务的模块,包括任务容器、任务调度定时器、异常捕获等模块,确保离线计算任务能够在资源容许的情况下,按计划运行。
1703952450
1703952451 平台安全,主要包括对数据访问权限的管理,把数据划分成不同的安全等级进行管理,当访问某些安全级别高的数据时,会触发一个审批流程,经过主管审批后才能访问。
1703952452
1703952453 资源申请,指的是对大数据平台的计算或存储资源发起一个使用请求,这里会记录每一个数据操作访问,以供日后审计。
1703952454
1703952455 技术管理之巅:如何从零打造高质效互联网技术团队? [:1703949775]
1703952456 9.2.2 云平台架构设计
1703952457
[ 上一页 ]  [ :1.703952408e+09 ]  [ 下一页 ]