打字猴:1.700504587e+09
1700504587 数据科学家养成手册 [:1700503500]
1700504588 数据科学家养成手册 2.4 本章小结
1700504589
1700504590 在对科学有了完整的认识以后,就可以开始了解科学在各个领域的渗透了。至于一种理论或一种学说是不是科学,我们已经可以通过最基本的定义来初步判断。不过,要从头整理一套经得起推敲的科学理论并非易事,很多时候,不仅可能要消耗一代甚至几代科学家毕生的心血,还需要科学家具有耐得住寂寞的平和性格和坚强不屈的伟大信仰。
1700504591
1700504592 这种科学的信仰和理念是一种可遵循的路径,是保证我们将前进的航船驶向正确方向的指南针。所以,要想研究数据科学,就一定要对科学有足够的认识。只有这样,我们才不会被充斥在周围的乱象所迷惑,最终获得正确的认知观念和知识。
1700504593
1700504594 (1) 在本书出版之前,此望远镜已经投入使用了。
1700504595
1700504596
1700504597
1700504598
1700504599 数据科学家养成手册 [:1700503501]
1700504600 数据科学家养成手册 第3章 数据与数学
1700504601
1700504602 数据科学家养成手册 [:1700503502]
1700504603 3.1 什么是数据
1700504604
1700504605 数据的英文是“data”,其实这是复数形式的“数据”,其单数形式是“datum”——英文解释是“a fact or piece of information”,即一个事实或一条信息。那么,从字面去解释“data”,就是很多事实或信息的混合体。
1700504606
1700504607 数据是什么?这几乎成为一个我们熟视无睹的问题。
1700504608
1700504609 我们平时看到的数字和字符、字母,都有可能是数据。
1700504610
1700504611 先看下面一组例子(如图3-1所示)。这里有6个0,请问它是数据吗?
1700504612
1700504613
1700504614
1700504615
1700504616 图3-1 例子(1)
1700504617
1700504618 再看一组例子(如图3-2所示)。这里有4个1和2个a,请问它是数据吗?
1700504619
1700504620
1700504621
1700504622
1700504623 图3-2 例子(2)
1700504624
1700504625 我们假设这两个例子都有一些比较特殊的前置场景。假设第一组的6个0其实是时、分、秒的简写,“000000”表示00点00分00秒,“112349”则表示11点23分49秒,那么它是不是数据呢?假设第二组出现的4个1和2个a其实是一组密码,“1111”代表一个约定地点,“aa”代表一个约定事件,这组数字和字母的意义就有了相应的解读,那么它是不是数据呢?
1700504626
1700504627 符号如果想被认定为数据,就必须承载一定的信息。信息很可能因场景而定,因解读者的认知而定,所以,符号是否能作为数据使用,解读者的主观视角具有决定性作用。解读者是否能够正确解读信息,将直接导致相应的符号是否能够被认定为数据。
1700504628
1700504629 数据无处不在。在网络上、报纸上、书籍上,在家用电脑的磁盘上,在我们的脑海里,数据大量且广泛地存在。围绕数据,人类已经做了很多数据科学的研究和应用工作,其中最为基础的就是数据的存储和传输。数据的价值在于数据上所承载的信息,信息的价值在于其消除不确定性时的成本及其直接和间接的作用,而这一系列的价值使得我们对数据的价值予以空前的重视,这就是我们热衷于研究数据科学的原因所在。
1700504630
1700504631
1700504632
1700504633
1700504634 数据科学家养成手册 [:1700503503]
1700504635 数据科学家养成手册 3.2 数学的奥妙
1700504636
[ 上一页 ]  [ :1.700504587e+09 ]  [ 下一页 ]