打字猴:1.70050508e+09
1700505080
1700505081 对于可以接入互联网的“节点”来说,只要能够将数据以数据包的方式报送给某个IP地址或者域名所对应的服务器就可以了。对使用Wi-Fi或者有线以太网的手机或PC用户来说,这种条件基本都是天然的了,因为它们所依赖的通信模块和上层的协议栈早已植入终端之中(如图4-15所示)。
1700505082
1700505083
1700505084
1700505085
1700505086 图4-15 有线以太网和无线以太网接入
1700505087
1700505088 在道路、旷野或其他有线以太网和Wi-Fi无法覆盖的地区也不是没有办法。例如,测量者通常会使用不同规格的DTU(Data Transfer Unit,如图4-16所示)模块进行连接。DTU向下连接检测设备,例如湿度探测器、温度探测器、PM2.5探测器、辐射探测器等;向上通过GPRS、3G-CDMA、4G-CDMA协议,甚至可以通过卫星信号,以类似拨号上网的方式接入互联网。
1700505089
1700505090
1700505091
1700505092
1700505093 图4-16 不同型号的DTU
1700505094
1700505095 这种方式的测量可以说是一种成本最为低廉的方式,几乎不需要任何人工干预就可以坐等各种探测器或者客户端程序把数据收集起来。这种方式基本已经应用于几乎全部的互联网、物联网类产品中,不仅性能稳定,可靠性也能达到了商用水平。
1700505096
1700505097 这种测量方式不仅出现在工业领域和一般的商用领域,在民用领域也已落地。现在有很多可以实现远程抄表的智能电表系统已经部署到了数不清的新建小区,也逐步进入老旧小区。还有不少小区安装了具有远程抄表功能的水表和煤气表(如图4-17所示)。
1700505098
1700505099
1700505100
1700505101
1700505102 图4-17 具有远程抄表功能的智能电表、水表和煤气表
1700505103
1700505104 这些量具同时完成了两件事,一件是测量,另一件是报送。这相当于我们在实验环境中所做的读数和记录工作,只不过读数的动作是由传感器把感应到的测量对象转换为电压、电流等模拟信号,再通过模数转换模块转化成为数字信号的方式实现的,而记录的动作是通过DTU模块连接到互联网或者其他专网,然后用数据包报送给服务器的。
1700505105
1700505106 目前,最为廉价的实现方式应该还是通过对嵌入式芯片(如图4-18所示)进行编程,用TCP、UDP或者HTTP协议将数据封装成套接字信息(5)或完整的SOAP请求(6)传递给服务器。为了保证传输的可靠性,可能会在其中加入一些复杂的控制行为。例如,对数据进行加密,或者针对网络故障导致报送失败时的重传等。
1700505107
1700505108
1700505109
1700505110
1700505111 图4-18 嵌入式芯片
1700505112
1700505113 除了刚刚说过的这些常见的测量设备以外,在过去的个半个世纪中,测量酸碱度、PM2.5浓度甚至咸度、甜度、辣度(如图4-19所示)等的仪器都被研制出来,使我们对原本不便量化的领域也有了量化和研究的机会。
1700505114
1700505115
1700505116
1700505117
1700505118 图4-19 辣度测量仪
1700505119
1700505120 应该说,没有量化,就没有科学,更没有数据科学。因此,这种一切都能量化、都要量化的思路是“科学”的基础,是现代各领域研究中非常提倡也不得不重视的根本问题。
1700505121
1700505122 数据科学家养成手册 [:1700503515]
1700505123 4.2.2 统计计算
1700505124
1700505125 1.人口普查
1700505126
1700505127 统计计算是一种最为朴素、客观的认知方式。这种认知方式其实是人类潜意识的产物,其出现时间远远早于统计学作为一门完整的学科出现在人类历史舞台的时间。
1700505128
1700505129 中国古代的帝王为了了解国家的状况和巩固自己的统治,很早就注重人口普查,这就是最早、最朴素的统计。我猜想,在文字记载比较丰富的周朝,或许周天子就曾问过大臣类似“我大周子民几何”的问题。了解一个国家的人口数量、人口分布、人口结构,就更能有的放矢,对制定国策、颁布法律、鼓励生产、发展军事与手工业等都有极大的好处。
[ 上一页 ]  [ :1.70050508e+09 ]  [ 下一页 ]