1700434150
所有这一切的关键是短小的迭代周期和分而治之的思想。这样设计的原因是由于两个方面,一方面是可以不断地显示进展,另一方面是过程中还存在一些不确定性。每次解决一点问题有助于更方便地解决不确定性问题,也能够更好地掌握在每个步骤中了解到的新东西。
1700434151
1700434152
灵活一些
1700434153
1700434154
探索分析的创新想法时,不可能总是100%地理解所有内容。制订计划时不用面面俱到,项目组在起步阶段不可能解决了所有问题。因此使用一种迭代的、灵活的方法探索创新的想法非常关键。在获得更多的信息之后,可以对计划进行调整,在这个过程中也能得到一些乐趣。
1700434155
1700434156
在我们的例子中,分析专家对大数据进行挖掘时需要非常灵活。那些数据可能不像我们所希望的那么干净,也不像我们所期待的那么完整。这些数据可能也没有达到计划中的预期价值。这都没关系。一旦分析专家就位并开始研究数据了,他们可能会认识到计划中的几个后续步骤并不完全正确。如果他们使用的是一种灵活的、迭代的方法,并且没有死板地按照最初的项目计划开展工作,那么他们随时可以调整计划并继续前进。只要团队知道分析努力的目标和他们试图证明的结果,他们就可以确保调整后一切都能步入正轨。
1700434157
1700434159
10.5 考虑换个角度
1700434160
1700434161
退休计划是为了管理你所面临的风险。未来某一天你计划退休时,退休计划是为了确保你有足够的资产来保障你退休后的生活。如表10-1所示,风险投资则遵循一种完全不同的模式。在风险投资环境中进行投资时,你希望在相对较短的时间框架下获得较大的回报。同时,在风险投资模式中有一个合理的风险,就是你有可能会损失全部或大部分的投资。
1700434162
1700434163
表10-1 退休计划与风险投资
1700434164
1700434165
1700434166
1700434167
1700434168
这里存在着一个风险与收益的平衡。如果投资者理解他们在做什么,并且做出了适当的选择,退休计划和风险投资都是完全合理的。今天许多著名公司,特别是技术、电子商务和社会化媒体领域的著名公司,都有风险投资的支持。风险投资可以产生惊人的回报,但是与每一个像谷歌、亚马逊这样成功的案例相比,失败的公司要多得多。
1700434169
1700434170
就像把所有的退休财产都按照风险投资的风格进行投资不够明智一样,把所有公司资源都拿来冒险或创新也是不明智的。确保公司能够生存并且能在稳步增长的过程中实现目标是很有必要的,就像人们必须实现退休目标一样。因此,必须对投向风险较大活动的资本额进行管理。但即使是退休金账户,也会有一定比例的资金投在风险较大的资产上。
1700434171
1700434172
多样化!
1700434173
1700434174
企业需要多样化。就像个人只把退休积蓄中的一小部分投入到风险较大的领域比较稳妥一样,企业只把人员、系统和资产中的一小部分投入到分析创新中就比较稳妥。如果在混合型的投资计划中不包含在创新方面的投资,这样的投资计划所带来的风险和过度地在创新方面进行投资的风险是差不多的。
1700434175
1700434176
然而,还有一个方面往往被人们忽略了。人们的退休金账户最终所面临的最大风险之一却是由于投资过于安全造成的。例如,如果退休金账户上100%都是政府债券,那也是有风险的,因为债券的收益也许仅仅只能抵消通货膨胀。尽管账户上的钱肯定不会减少,但可能无法达到预期的收益目标。本金可以保证不损失,但同时账户上的钱肯定无法保证我们及时退休!
1700434177
1700434178
面对大数据和分析时,如果公司仅仅采用安全的做法而不做其他努力,那么也将面临与退休金账户一样的风险。如果公司希望沿着当前的路线继续长期发展,那么有必要主动引入一些投资风险。建立分析创新中心就是一种很好的创新机制。
1700434179
1700434181
10.6 你是否为建立分析创新中心做好了准备
1700434182
1700434183
对大数据和高级分析都能有所帮助的一般性概念是建立一个分析创新中心。分析创新中心能推动对新想法的快速探索,能缩短想法的构思与想法的正式执行、实现之间的延迟。分析创新中心拥有监督机制和想法筛选流程。这不是一种一切都很混乱的无序状态。与常见的企业官僚主义做法相比,决策和审批的过程都大大加速了。我们来看看它的工作原理。
1700434184
1700434185
把概念整合起来
1700434186
1700434187
分析创新中心把前9章的概念整合到了一起。它用到了第一部分讨论到的大数据源,用到了第二部分概述的工具、过程和技术,以及第三部分概述的人和方法。建立分析创新中心是一种驾驭大数据,并对大数据进行创新分析的方法。
1700434188
1700434190
10.6.1 组件1:技术平台
1700434191
1700434192
分析创新中心需要一个技术平台来保留并分析目标工程所需要的数据。创新中心的基础架构需要逻辑上独立并且清晰。中心的团队将需要致力于研究数据库资源、分析工具、网络带宽等。企业级数据仓库(最理想的)、分析平台或者数据集市往往是一个不错的起点。为了处理大数据源,中心还需要一个系统来辅助处理半结构化和非结构化的大数据。就像我们在第4章中讨论的,MapReduce框架是满足这一需求最合适的选择。
1700434193
1700434194
环境需要能够访问现有平台上的数据,因为任何数据都可能需要进行分析。在此基础上,中心需要能够从新的数据源加载和分析数据。分析创新中心开展的许多工程将使用新的数据源来开展实验,然后看看能否与其他数据进行结合,以获得所需的价值。
1700434195
1700434196
根据已有的讨论,分析创新中心的技术实际上是非常容易理解的。从实现的角度来看,分析创新中心的基础架构就像我们在第5章中说到的分析沙箱一样简单。就像在企业数据仓库或数据集市中安置沙箱以便进行每日分析一样,可以在分析创新中心创建一个专用的沙箱环境。然而,为中心分配的资源应当与为每日分析沙箱分配的资源相分离。当涉及中心的MapReduce环境时,可以把已存在的环境留出一部分来给创新中心,或者实现一个独立的、专用的MapReduce环境以便顺利实现创新分析中心。
1700434197
1700434198
为分析创新中心创建基础架构不应该那么麻烦。为了满足企业的其他分析要求,所有的资源都已经以某种形式就位了。我们要做的只是为中心隔离出一些资源。根据库内分析和沙箱原则,不需要重新购买一整套的软件或者设备。
1700434199
[
上一页 ]
[ :1.70043415e+09 ]
[
下一页 ]