1703952431
HBase,一个分布式的,列存储数据库,使用HDFS作为底层存储,同时支持MapReduce的批量式计算和点查询。
1703952432
1703952433
Zookeeper,一个分布式的,高可用的协调服务。提供分布式锁之类的基本服务,用于构建分布式应用。
1703952434
1703952435
Hive,分布式数据仓库,Hive管理HDFS中存储的数据,并提供基于SQL的查询语言用以查询数据。
1703952436
1703952437
Hama,建立在Hadoop上的分布式并行计算框架,基于Map/Reduce和Bulk Synchronous的实现框架,运行环境需要关联Zookeeper、HBase、HDFS组件。
1703952438
1703952439
Mahout,一个基于MapReduce的机器学习算法库,运行在Hadoop集群上。
1703952440
1703952441
Cassandra,一种混合的非关系型数据库,类似于Google的BigTable。
1703952442
1703952443
以上就是数据存储层中,用到的一些开源数据框架,我们继续看大数据平台的其他组成部分。
1703952444
1703952445
数据同步分发,这个组件对数据同步和分发做统一管理,可实现异步、分布式的数据同步和分发。
1703952446
1703952447
监控,指的是对大数据平台的服务和资源,进行监控和预警,包括数据存储的可用性、性能、系统负载、资源请求的响应时效等。
1703952448
1703952449
离线计算,处理离线计算任务的模块,包括任务容器、任务调度定时器、异常捕获等模块,确保离线计算任务能够在资源容许的情况下,按计划运行。
1703952450
1703952451
平台安全,主要包括对数据访问权限的管理,把数据划分成不同的安全等级进行管理,当访问某些安全级别高的数据时,会触发一个审批流程,经过主管审批后才能访问。
1703952452
1703952453
资源申请,指的是对大数据平台的计算或存储资源发起一个使用请求,这里会记录每一个数据操作访问,以供日后审计。
1703952454
1703952456
9.2.2 云平台架构设计
1703952457
1703952458
云平台是个非常宽泛的领域,本节侧重介绍企业私有云平台的架构,大家知道云平台可以分成:IaaS基础设施即服务、PaaS平台即服务、SaaS软件即服务。如图9-10所示,这是一个完整的企业级应用平台,从底层的存储资源、计算资源、网络资源,到中间层的容器服务、缓存服务、健康检查服务等,再到最上层的业务应用、接口应用等,这是用云的架构思想,构建的企业级应用。
1703952459
1703952460
1703952461
1703952462
1703952463
图9-10 云平台技术架构
1703952464
1703952465
下面我们重点介绍IaaS部分,通过打造Iaas来构建企业级的私有云平台。如图9-11所示是Iaas的架构图,我们把私有云平台分成:配置管理、ITIL、虚拟资源管理、物理资源管理、自动调度和监控。
1703952466
1703952467
1703952468
1703952469
1703952470
图9-11 IaaS架构设计
1703952471
1703952472
配置管理,所有IT资产进行登记管理,包括服务器硬件、网络设备、虚拟机、网络配置、应用部署管理、变更管理、应用发布信息管理、操作员、权限等,是云平台的基础信息配置管理中心。
1703952473
1703952474
ITIL,是软件定义资源池、容量计划、监控门户等,是对资源进行统一治理的模块,制定针对当前资源使用情况的容量计划,监控人员的日常工作平台。
1703952475
1703952476
虚拟资源管理,是对虚拟主机、虚拟网络、虚拟存储的管理系统,能够自动化完成虚拟化工作,包括自动化装机、自动化网络配置,对虚拟资源的开通、回收提供统一管理入口,根据应用负载情况,能够触发自动增加虚拟主机,并且部署应用。
1703952477
1703952478
物理资源管理,对服务器、存储设备、交换机设备的统一管理系统,基于物理硬件的自动维护、上架和下架、重启等。
1703952479
1703952480
自动调度和监控,功能包括自动添加和踢出应用节点,根据负载自动调节资源数量,提供基于云端的监控服务。
[
上一页 ]
[ :1.703952431e+09 ]
[
下一页 ]