1700511320
(1)统计学
1700511321
1700511322
通过对统计学的系统学习,熟悉大量样本分析过程中的注意事项和技巧,以及科学的分析方法论。
1700511323
1700511324
(2)高等数学
1700511325
1700511326
通过对微积分领域的学习,理解一种哲学或思维方式。
1700511327
1700511328
(3)数据挖掘和机器学习
1700511329
1700511330
将这两个领域一起研究,而且不建议强行区分两者。这两个领域都是在研究数据内在联系的逻辑,并寻求用简洁的方式加以描述和印证。
1700511331
1700511332
(4)深度学习与人工智能
1700511333
1700511334
这个领域在未来是非常有前途的,因为“用机器代替人”本身就是一个历史趋势,而且从未改变。所以,这个领域是一个经得起时间考验的研究领域,在未来几十年都会有很好的应用场景,而且随着计算机处理能力的增强,这个趋势也会越来越明显。
1700511335
1700511336
问:数据科学和大数据有什么区别?它们是同一种东西吗?
1700511337
1700511338
答:数据科学是一个笼统的概念,而且每个人对这个概念的认知与定义都不相同。我建议不要太过纠结这个概念圈定的范围是什么,只要把一种科学的认知观念带到日常工作和实践中就可以了。
1700511339
1700511340
大数据比数据科学的范围更为具象。数据通过各种软件进行收集,通过网络进行传输,通过云数据中心进行存储,通过数据科学家或者行业专家进行建模和加工。通过数据分析得到的是一种知识,是一种人们通过数据洞悉世界的能力。数据之间原本错综复杂的潜在关系,会使大量孤立且多来源的数据因为同时出现在一个舞台而显得更为有趣,大量看似不相关的事情却能够通过观察与分析使人们知晓更多背后的因果。这些因果联系的意义会让人们能够在各个方面推测未来的趋势,减少试错的机会,缩减成本,降低风险,解放劳动力。这是大数据产业本身的价值与意义所在。
1700511341
1700511342
问:数据科学能解决所有的问题吗?
1700511343
1700511344
答:数据科学作为一种贯穿于所有生产与认知领域的学科,是一种类似方法论的学科。因为未知事物永远比已知事物多,所以如何正确地、科学地认知未知事物并使其成为已知,就是一个指导思想方面的问题了。形成这样一种思维方式比具体解开一个局部性的问题更为重要。
1700511345
1700511346
数据科学的套路也非常固定。
1700511347
1700511348
(1)建立假说
1700511349
1700511350
建立一个概念假说作为研究的目标。
1700511351
1700511352
(2)观测与证明
1700511353
1700511354
将这个假说的条件和环境设定放到生产生活中加以观察,或者干脆在实验室环境中设计一个完整的实验,通过不断地观测,尤其是量化观测,对假说的内容进行证明或证伪。因为数据科学本身就注重精确性(也就是量化环节),而且一切科学全都是以实验为本,也就是说,以观测到的结果作为认知依据,以此判定是否应验,所以这个量化观测最为关键。
1700511355
1700511356
(3)归纳与调整
1700511357
1700511358
在观测的过程中会获得大量的观测数据,要对这些数据进行充分且科学化的分析,然后根据这些数据进行归纳总结,进而对假说的内容进行相应的调整。因为最初假说中的内容很可能与实际的观测结果有出入,所以这个时候就要在辩证思维的帮助下去发现和排除观测中不周密的因素,或者重新审视假说的严谨性,并进行相应的调整。
1700511359
1700511360
这种套路可以复用在很多的科学与生产场景中,屡试不爽。
1700511361
1700511362
问:数学不好是不是就不能学习数据科学呢?
1700511363
1700511364
答:首先,数据科学作为一种贯穿于所有生产与认知领域的学科,是一种方法论类型的学科。既然是方法论,那么学习过程中要着重理解其运作方式。
1700511365
1700511366
所谓数学不好,或许是指无法在课堂上解决数学题或者不具备用数学建模的方式解决复杂问题的能力。但是,对于事物的认知,尤其是基于统计的认知,关键在于悉心观察与思考,而是否一定要用高深的数学功底去解决一个问题,要视所在领域而定。所以,数学不好对于学习数据科学的影响是有限的,我们只要能在自己擅长的领域去应用数据科学的认知方式就好。
1700511367
1700511368
问:数据科学能帮我们解决具体问题吗?
1700511369
[
上一页 ]
[ :1.70051132e+09 ]
[
下一页 ]