打字猴:1.700511313e+09
1700511313 数据科学家养成手册 [:1700503697]
1700511314 数据科学家养成手册 第19章 本书相关内容问与答
1700511315
1700511316 问:数据科学现在这么火,有没有学习的路线图呢?
1700511317
1700511318 答:数据科学是一种研究信息感知、抽象、保存、建模、传输,以及数据之间逻辑、数量统计与计算和转化关系的应用科学。数据科学的本质就是表述和指导对事物认知的关系量化,把普适性的科学思维方式应用到数据上,使其成为一门窄而深的、体系完整的、精确的学科。这就是数据科学要解决的本质问题。也就是说,只要是做其中一个方面或者一个子领域的工作,就是在研究数据科学。只不过我们平时口中的“数据科学”通常偏重于数据分析,即通过对数据的挖掘与分析消除不确定性,汲取剩余价值。单纯从这个角度来说,我认为应该学习的领域有这样4个。
1700511319
1700511320 (1)统计学
1700511321
1700511322 通过对统计学的系统学习,熟悉大量样本分析过程中的注意事项和技巧,以及科学的分析方法论。
1700511323
1700511324 (2)高等数学
1700511325
1700511326 通过对微积分领域的学习,理解一种哲学或思维方式。
1700511327
1700511328 (3)数据挖掘和机器学习
1700511329
1700511330 将这两个领域一起研究,而且不建议强行区分两者。这两个领域都是在研究数据内在联系的逻辑,并寻求用简洁的方式加以描述和印证。
1700511331
1700511332 (4)深度学习与人工智能
1700511333
1700511334 这个领域在未来是非常有前途的,因为“用机器代替人”本身就是一个历史趋势,而且从未改变。所以,这个领域是一个经得起时间考验的研究领域,在未来几十年都会有很好的应用场景,而且随着计算机处理能力的增强,这个趋势也会越来越明显。
1700511335
1700511336 问:数据科学和大数据有什么区别?它们是同一种东西吗?
1700511337
1700511338 答:数据科学是一个笼统的概念,而且每个人对这个概念的认知与定义都不相同。我建议不要太过纠结这个概念圈定的范围是什么,只要把一种科学的认知观念带到日常工作和实践中就可以了。
1700511339
1700511340 大数据比数据科学的范围更为具象。数据通过各种软件进行收集,通过网络进行传输,通过云数据中心进行存储,通过数据科学家或者行业专家进行建模和加工。通过数据分析得到的是一种知识,是一种人们通过数据洞悉世界的能力。数据之间原本错综复杂的潜在关系,会使大量孤立且多来源的数据因为同时出现在一个舞台而显得更为有趣,大量看似不相关的事情却能够通过观察与分析使人们知晓更多背后的因果。这些因果联系的意义会让人们能够在各个方面推测未来的趋势,减少试错的机会,缩减成本,降低风险,解放劳动力。这是大数据产业本身的价值与意义所在。
1700511341
1700511342 问:数据科学能解决所有的问题吗?
1700511343
1700511344 答:数据科学作为一种贯穿于所有生产与认知领域的学科,是一种类似方法论的学科。因为未知事物永远比已知事物多,所以如何正确地、科学地认知未知事物并使其成为已知,就是一个指导思想方面的问题了。形成这样一种思维方式比具体解开一个局部性的问题更为重要。
1700511345
1700511346 数据科学的套路也非常固定。
1700511347
1700511348 (1)建立假说
1700511349
1700511350 建立一个概念假说作为研究的目标。
1700511351
1700511352 (2)观测与证明
1700511353
1700511354 将这个假说的条件和环境设定放到生产生活中加以观察,或者干脆在实验室环境中设计一个完整的实验,通过不断地观测,尤其是量化观测,对假说的内容进行证明或证伪。因为数据科学本身就注重精确性(也就是量化环节),而且一切科学全都是以实验为本,也就是说,以观测到的结果作为认知依据,以此判定是否应验,所以这个量化观测最为关键。
1700511355
1700511356 (3)归纳与调整
1700511357
1700511358 在观测的过程中会获得大量的观测数据,要对这些数据进行充分且科学化的分析,然后根据这些数据进行归纳总结,进而对假说的内容进行相应的调整。因为最初假说中的内容很可能与实际的观测结果有出入,所以这个时候就要在辩证思维的帮助下去发现和排除观测中不周密的因素,或者重新审视假说的严谨性,并进行相应的调整。
1700511359
1700511360 这种套路可以复用在很多的科学与生产场景中,屡试不爽。
1700511361
1700511362 问:数学不好是不是就不能学习数据科学呢?
[ 上一页 ]  [ :1.700511313e+09 ]  [ 下一页 ]