1704129618
我们知道,一个规模庞大的企业的管理人员都具备前瞻性,他们都认为对自己企业遗留的基础设施进行现代化改造越早越好,但出于谨慎,他们不会一夜之间就把自己的关键环节弃而远之。大企业之所以会如此谨慎有两方面原因:一是大数据公司普遍为初创企业,大企业对由年轻的公司来处理自己的基础设施难免感到不放心;二是大企业对于安全的担忧,大多数企业都会拒绝把数据迁移到云端。
1704129619
1704129620
从大数据行业的内部来看,大数据的成功不是由实现技术的某一方面而实现的,它需要把技术、人和流程糅合到一起,收集数据、存储数据、清洗数据、查询数据、分析数据和对数据进行可视化等工作是有分工的。有的由机器来完成,有的需要人来做,但是整体是要无缝集成起来的,也就是说,以数据为中心,公司整体以数据为驱动。
1704129621
1704129622
对于大数据的发展,我把它分为下面5个阶段。
1704129623
1704129624
1.部署阶段
1704129625
1704129626
2011—2013年,互联网公司开始实验大数据技术,推出了若干的Hadoop(一个开发和处理大规模数据的软件平台)试点计划或者尝试了一些试点方案,由此出现了诸如“数据科学家”和“首席数据官”等此前并不存在的职位。他们做了很多努力,但是依然没有出现足够多的、可以展示的成果。此时,更多的公司对大数据技术持观望态度,它们寄希望于某个大型供应商可以提供一个一站式解决方案,比如IBM公司,但这种情况并没有出现。
1704129627
1704129628
2.生态体系正在成熟
1704129629
1704129630
当一部分大数据企业完成了融资,企业规模得到了扩大时,更重要的是它们从早期的失败中获得了宝贵的经验,已经可以提供成熟、经受过考验的产品。其中的佼佼者已经成功上市,比如2015年上市的Hortonworks公司;没上市的也已经获得上亿美元融资,在资金方面看起来不会显得那么单薄,比如Cloudera公司。
1704129631
1704129632
随着大数据领域的创业持续进行,公司的数量与日俱增。行业的基本趋势也慢慢发生了变化,大数据业务的中心从基础设施(开发者和工程师)转移到了数据分析(数据科学家和分析师),甚至在应用方面也已经初露端倪。
1704129633
1704129634
3.大数据基础设施持续创新
1704129635
1704129636
尽管大数据的重心已经转移,但是基础设施领域的创新仍然富有活力。2015年,Apache Spark大热,这个利用了内存处理的开源框架受到了IBM、Cloudera等企业的拥护。Apache Spark的出现解决了一些导致Hadoop采用放缓的关键问题:Apache Spark数据分析更快,更容易编程,并且跟机器学习能够很好地搭配。
1704129637
1704129638
在数据库领域内,出现了很多新兴玩家,也出现了很多令人兴奋的技术进步,比如图形数据库的成熟、专门数据库的出现,再比如统计时序数据库InfluxDB。此外,数据仓库也在不断演变。
1704129639
1704129640
4.大数据分析与人工智能结合
1704129641
1704129642
大数据分析越来越关注利用人工智能来帮助分析大规模的数据。其实,有很大一部分人工智能在某种程度上来说是大数据的产物,深度学习概念在10年前提出,而其背后的算法在几十年前就诞生了,但它真正发挥出最大的潜能还是在应用到大数据之后。人工智能与大数据之间的关系非常紧密,它们似乎就是天生的一对搭档。
1704129643
1704129644
5.大数据应用的加速发展
1704129645
1704129646
在大数据核心基础设施的挑战一一得到解决之后,大数据应用必将以飞快的速度构建起来。在企业内部,已经有足够多的工具来帮助跨多个核心职能的企业用户,比如销售和营销的大数据应用通过处理大规模的内外部数据就可以分析出哪些客户会购买、续约或者流失,并且这些分析结果都将实时得出。
1704129647
1704129648
这些大数据应用依托在最新的大数据技术基础上开发,客户无须部署底层大数据技术,即可利用大数据;而底层的技术已经是打包的,这是未来的一个趋势。另外,人工智能在应用层也将得到广泛应用,比如在安全领域用来对付黑客。
1704129649
1704129650
然而,随着大数据的深度发展,这个词可能会变得越来越冷。不是因为它过时或者不重要了,而是因为它将成为未来科技的血液,在我们看不到的地方发挥作用。对于技术层面的东西,这或许就是最好的命运归宿。
1704129651
1704129652
1704129653
1704129654
1704129656
智能主义:未来商业与社会的新生态 大数据技术助力人工智能发展
1704129657
1704129658
“人工智能”概念的提出时间,最早可以追溯到1956年。在长达60年的发展历程中,出现过人工神经网络、机器学习、知识表现、智能搜索、模糊逻辑等实现人工智能的方法。然而限于技术的制约,真正的人工智能还仅仅停留在人们的幻想之中,现实中的人工智能基本上停留在微创新阶段,鲜有大的突破。
1704129659
1704129660
如今,人工智能的发展速度和热度都达到了历史顶峰,这背后最大的动力来源就是大数据技术的成熟。比如机器学习,它是这样一个过程:从数据中自动分析并获得规律,从而对未知数据进行预测。目前这一技术被广泛应用在互联网搜索、垃圾邮件过滤、机器翻译、在线广告、手写识别等方面。
1704129661
1704129662
各类大型网站每天可以积累大量的用户数据,包括商品交易、搜索、社交等,企业利用大数据技术可以对数量巨大、种类繁多、价值密度极低、变化迅速的数据进行有效且低成本地存取、检索、分类和统计。在大数据技术的推动下,智能化可以更好地对纷杂的场景做出精确反应,使人工智能更具有想象空间。
1704129663
1704129664
我认为,在2020年之前,国内将有200亿台设备连接到互联网,直接的结果就是产生更多的数据,那时候会是真正的大数据时代。当然,这200亿台设备不只是手机和计算机,那时手机的保有量大约在15亿部,大约平均每人1.5部,计算机估计会有6亿台,而更多的联网设备是“物”,即你家里的家具、家电,你戴的眼镜、手表等,都可能成为联网设备,内置一个智能系统,通过4G或Wi–Fi与互联网相连。这些设备会产生巨量数据,到时候我们生活中所有的数据都会被传送到云端。
1704129665
1704129666
不过,在企业利用这些数据的时候,我觉得还是有一些需要特别注意的地方,企业应该平衡好大数据利用与用户隐私之间的关系。另外,保护好用户的信息也是企业义不容辞的责任。我认为,用户信息的保护应该遵循前文提到的“用户信息安全三原则”。
1704129667
[
上一页 ]
[ :1.704129618e+09 ]
[
下一页 ]