1700505001
1700505002
第二代计算机出现的时候,生产技术基础发生了改变,人们开始采用晶体管制造电子计算机。国外第二代电子计算机的生存期大约是1957年~1964年。从第三代计算机开始就是集成电路电子计算机,元器件的尺寸越来越小,集成的规模越来越大。据美国著名计算机零件和CPU制造商英特尔(Intel)公布的数字,Ivy Bridge 6核i7 CPU集成的晶体管数量高达18.6亿个,工艺规格已经到达14nm(晶体管和晶体管之间导线的宽度,简称“线宽”)——要知道,一个铁原子的直径也不过0.25nm。
1700505003
1700505004
众所周知,目前的电子计算机使用的计算与存储介质都是二进制的。这不是偶然的结果,而是由电子计算机的实现原理造成的。在ENIAC的设计过程中,冯·诺依曼(John von Neumann,1903年12月~1957年2月,如图4-8所示)根据半导体电子元件的二稳态特性,将计算机的计算逻辑设计为二进制方式(即只有“0”和“1”两种状态),在电子管上体现出来的特性就是“截止”和“导通”(如图4-9所示)。而人类喜欢使用十进制也主要是因为人有10根手指,在日常生活中用十进制进行计算最为便利。
1700505005
1700505006
1700505007
1700505008
1700505009
图4-8 冯·诺依曼
1700505010
1700505011
1700505012
1700505013
1700505014
图4-9 电子管
1700505015
1700505016
在计算过程中,计算机将“与门”、“或门”、“与非门”、“或非门”等逻辑元件组合在一起,模拟计算进位的过程,进而形成完整的计算实现单元(如图4-10所示)。用电子计算机实现的任何一种运算都是由这些逻辑门组合而成的,而这之后在电子计算机领域不断进行的技术改进都是基于同样的原理。尽管元件的体积越来越小,集成的程度越来越高,计算的速度越来越快,但从计算逻辑和实现的数学层面来说,其原理没有本质的变化。
1700505017
1700505018
1700505019
1700505020
1700505021
图4-10 逻辑门
1700505022
1700505023
在硬盘技术方面也同样不断进行着量变的积累。无论盘片容量是500GB还是1TB甚至更高,都是通过磁头机械臂在盘片上滑动的同时高速转动盘片来实现磁性材料持久化和材料状态感应(如图4-11所示)。计算中使用的“0”和“1”,就可以通过这种持久化以磁介质疏密(磁通量的高低)写入磁性材料层。
1700505024
1700505025
1700505026
1700505027
1700505028
图4-11 机械硬盘及其读写原理
1700505029
1700505030
展望未来,量子计算机(如图4-12所示)和光子计算机的研发已经展开。这些新型计算机尽管实现原理不同,但只要成本足够低,而且与目前的电子计算机采用相同的工业标准,使双方在存储介质、信息传输等多个方面能够毫无障碍地互联互通,其未来就非常值得期待。
1700505031
1700505032
1700505033
1700505034
1700505035
图4-12 加拿大D-WAVE公司的量子计算机
1700505036
1700505037
信息经过抽象、建模,落实到介质上成为数据。数据与不同特性的介质结合,在各种介质上落地的形式也不完全一样,而这种结合通常是数据去迎合介质的特性。有意义的数据落在介质上,才能形成可以传递的信息,这就是信息产业赖以生存的基础。
1700505038
1700505040
4.1.3 数据科学的本质
1700505041
1700505042
在了解科学和数据的定义后,我们基本可以给数据科学下一个完整的定义了——数据科学是一种研究信息感知、抽象、保存、建模、传输,以及数据之间的逻辑、数量统计、计算和转化关系的综合应用科学。数据科学的本质就是表述和指导对事物认知的关系量化,把普适性的科学思维方式应用到数据上,使其成为一门窄而深的、精确的、拥有完整体系的学科。这就是数据科学要解决的本质问题。
1700505043
1700505044
如果尝试对数据科学这个庞大的体系进行细分,可以分为很多专注于数据某一方面处理的专项学科。例如,数据贮存学研究数据存储中的数据体积、存取效率、可靠性问题等,数据传输学研究传输速度、传输质量问题等。在这两个大的领域中,所有可能影响数据存储和传输的因素都会被讨论和研究,计算机硬件制造、光电信号传输、数据有损/无损压缩、数据冗余与高可用、数据校验等都是研究的对象。
1700505045
1700505046
此外,还有研究如何在数据中进行信息抽象、计算、查找、分析等诸多度量与换算问题的数据算法学,以及其他一切能够对数据的感知、抽象、保存、建模、传输,甚至是数据的可视化、数据之间的辩证逻辑提供支持的学科等。其他分类同样会由于产业分化的需要而随时产生。这种平衡中的变化不断发生,一些小的分支和分类也会由于科研工作者潜移默化的努力而逐渐融合为一个大的分支。这些方式同样是仁者见仁,智者见智,不一而足。
1700505047
1700505048
1700505049
1700505050
[
上一页 ]
[ :1.700505001e+09 ]
[
下一页 ]