打字猴:1.700505235e+09
1700505235 标准化的好处显而易见——输入的内容是标准的,操作的内容是标准的,那么输出的内容就是标准的,这对输出成果的性状与预期一致有极高的保障作用。
1700505236
1700505237 以工人使用的机床为例,人们常说的“车钳铣刨”就是以前工人师傅的4个主要工种,即车工、钳工、铣工、刨工,他们都有对应的工具。例如,车工一般使用“车床”作为工具,铣工就用“铣床”,刨工就用“刨床”等。这些车床的使用全凭工人师傅手上的功夫。例如,使用车床的车工,主要是用车刀对旋转的工件进行车削加工,所有的尺寸都在车工的脑子里,所有的操作都由车工通过细腻的手法来调整,从而保证车出的零件光滑圆润。一位车工在上岗前通常需要经过大量的培训及至少几个月的实习,而在实际工作时,精神状态、情绪、疲劳程度等会使工作步骤、尺度把握出现偏差,从而产生一定的废品率。因为与生俱来的生理和心理特性,所以人类很难一直保持稳定的工作状态,不然也不会把这类工作称为“技术工种”了。
1700505238
1700505239 有了数控机床就大不一样了(如图4-26所示)。数控机床使用半自动或者全自动的程序进行控制,刀具使用的时间、角度、深浅都像复刻出来的一样,工作1次和工作10000次得到的产品完全相同。而且,机器不知疲倦,没有情绪影响,在工序复杂的零件加工方面,对效率的提升更加明显。据一些有经验的工人师傅说,对于一些简单的加工工件,使用数控机床能使工作效率提高3~5倍,而对于那些复杂工件,效率可以提升30倍甚至更多,且废品率极低。
1700505240
1700505241
1700505242
1700505243
1700505244 图4-26 普通铣床和数控铣床
1700505245
1700505246 我们来看一组数据。30多年来,中国的CPI(Consumer Price Index,居民消费价格指数)不断攀升,明显地反映了物价上涨的趋势(如表4-1和图4-27所示)。但是,我们每个人都能感觉到工业品价格的涨幅远没有这么明显,有些甚至在下降。
1700505247
1700505248
1700505249
1700505250
1700505251 图4-27 1979年至2014年CPI累加指数(11)
1700505252
1700505253 表4-1 1979~2014年中国CPI指数
1700505254
1700505255
1700505256
1700505257
1700505258 表4-1展示了1979年到2014年中国CPI指数的统计信息,图4-27则把指数累加值转化成了曲线图。从图表上看,1979年CPI累加指数为100,而2014年为584.1。也就是说,1979年价值100元的物品在2014年价值已经达到584.1元;或者说,2014年的584.1元在1979年只能当成100元使用。
1700505259
1700505260 就算不看这些数据,我们自己也会有感觉——这些年有些东西的价格上涨得特别快(例如农业产品),但是也有不少东西的价格确实在下跌。1983年,国内组装桑塔纳汽车的价格约为30万元,我们算一算这笔钱在2012年能“兑换”成多少元——大约是149万元。2012年,大众新桑塔纳的平均价格约为10万元,这笔149万元的“巨款”几乎可以买到15辆新桑塔纳!这种反差是十分惊人的。
1700505261
1700505262 为什么有这么大的差距呢?一个很重要的原因就是工业品生产能力的提高远高于CPI的增长速度。工业品为什么能有如此巨大的生产能力提升呢?其中很重要的因素就是生产技术的自动化,以及大规模生产线的使用,而更为重要的因素是标准化。这种标准化建立的基础就是期望用数字对生产条件进行约束,以达到生产条件一致,进而达到生产成果一致的情形。这种模型的稳定性对于资本的吸引力是明显的,也是巨大的——谁都喜欢这种算得明白、预期应验性高的买卖。要讨论为什么稳定性会有如此大的吸引力,就几乎等同于讨论在全社会范围内是劳动谋生靠谱还是买彩票谋生靠谱。我想答案不言自明——这不正是数据科学的成就吗?
1700505263
1700505264 数据科学家养成手册 [:1700503519]
1700505265 4.3.2 破除迷信
1700505266
1700505267 人们热衷于进行各种数据观测、拟合,希望对数据进行可期望的预判。这种行为本质上是在做什么呢?用带有一定功利色彩的眼光来看,这实际上是一个趋利避害的过程。
1700505268
1700505269 在我国古代科学技术尚不发达的时候,巫蛊之术盛行。人们祈求神佛保佑,相信自己的虔诚能够感动神灵,赐予自己实现愿望的能力——这就是人们经常说的“保佑(某人或某事)”。直到现在,人们仍然分成两派,分别坚持自己的观点。
1700505270
1700505271 观点一:这完全是封建迷信,是愚昧的表现,根本不可信。
1700505272
1700505273 观点二:神灵是存在的,如果不信,只是因为“凡夫俗子”没有这种感悟,或者不够虔诚,所以无法打动神灵来保佑。
1700505274
1700505275 这两种观点,即使不是极端敌对,非要除对方而后快,也至少是互相不以为然,绝无调和的可能。
1700505276
1700505277 在本书最开始的部分,在对科学家的特征进行归纳的过程中其实已经明确过了——科学是测量的学科,是量化计算的学科,而且即使不具备突破性,也需要精确性和体系性这两个最为基本的特性。那么,我们不妨想想,我们信任科学的根本原因是什么?科学能够精确地通过量化地进行“应验”,而这个过程中对数据的观测、拟合,以及对模型的归纳,又是在做什么呢?调整的最终目的是为了让模型所表达的“体系”和观测的现象一致。这个“一致”是非常重要的,因为不“一致”就是不能“应验”。
1700505278
1700505279 对于不能“应验”的东西,会有人感兴趣吗?我不知道,因为我也确实看到,从古至今无数人对玄而又玄的东西感兴趣,甚至对“通灵”感兴趣。尤其是在中国魏晋南北朝时期,士大夫阶层都非常热衷于谈论玄学。然而,这种东西在民间和商界不容易传开也是有原因的,恐怕不能单单归咎于除士大夫阶层以外的人都蠢笨之极——也确实不可能是这样。不能“应验”的东西一定不能用于大规模生产的普及,也不能用于生产技术的改进,而不能直接或间接发展生产力的东西通常经不住时间的考验,也不会在整个社会受到广泛认可。不用举太多例子,不论是什么主义,什么理论,什么技术,如果最终不能对发展生产力有帮助,则大都昙花一现,很快就会淹没在历史的洪流之中,或者被束之高阁,成为人们茶余饭后的谈资,并不会得到普及。
1700505280
1700505281 再回来看看那些虔诚祈求神灵进行帮助的行为。有人能说得清需要使用多少量的虔诚能够获得多少量的神灵的帮助吗?退一步讲,假设这种关系或者规律客观存在,那么它能被丈量吗?如果无法丈量,就无法得到量化关系。这种行为的危害是什么?因为这是一个无法自圆其说的体系性解释模型,所以后面的事情就没办法指望了。例如,精确地预测神灵的庇佑量,模型的改进也没办法期许——经过怎样的改进能够使神灵的庇佑增加10%或更多?这种极为“不稳定”的输出与输入关系使可预测性极差,自然是不能商用的,因为量化的商业模型不存在,也就不知道该投入多少资金,耗费多少时间,获得多少收益。这些不可期许的利益对天生必须靠打算盘来核算成本和收益的商人来说是绝对无法接受的——没办法,还得回去琢磨怎么从原料和人工上省钱,怎么通过满足客户偏好甚至市场的宏观需求来多赚钱。不仅如此,估计连普通人也不会再热衷于对这些事情进行研究,除非完全当成业余爱好——这就跟科学没有任何关系了。
1700505282
1700505283 目前世界范围内没有出现过任何一个能够量化虔诚和庇佑关系的模型,哪怕是萌芽性的观点都没有。所以,这种东西我们没办法认定其为科学,并不是因为它是从远古蒙昧时期流传下来的,而是因为它不符合科学的定义。即使真的有这种关系,即使有相当数量的人笃信神灵与庇佑的存在,只要它不能量化,不能进行量化的验证,就不能被认定为科学。补充一句,严谨地说,我同样不能斩钉截铁地否认它的存在。从科学的角度来讲,至少我无法证明它一定不存在——它,只是不科学。
1700505284
[ 上一页 ]  [ :1.700505235e+09 ]  [ 下一页 ]