打字猴:1.700505214e+09
1700505214 我们的校园生活中也有这样的事情。不论大考小考,尤其是像模拟考试这种重磅的考试结束后,老师都要做试卷分析。如果一个班级多门课的平均分是80分,那么最吸引老师眼球的一定不是得80分的学生,而是那些得到90多分甚至100分的学生和得到60多分甚至不及格的学生。让得到90多分甚至100分的学生分享经验,给只得到60多分甚至不及格的学生好好补课,通常被认为是两种最有效的改进方式。
1700505215
1700505216 这种从研究聚合指标深入到研究组成它的独立指标的过程,我们称为“下钻”(Drill Down)。下钻分析在商务智能中应用非常广泛,很多的指标都可以根据同比和环比数据对公司运营和工厂生产情况进行监控。例如,在炼油厂会有“吨油冶炼成本”这种用于监控成本的指标,在互联网企业会有“日活人数”(Daily Active User,DAU)这种用于监控活跃用户数量的指标,在铁路交通部门会有“10亿吨千米事故率”这种用于监控安全状况的指标等。这些指标能在很大程度上帮助运营人员化繁为简,集中精力,快速发现问题。对各行各业、各种对象的信息,只要合理量化,就能建立合理的指标系统并进行日常运营监控,这才是指标系统的意义。
1700505217
1700505218
1700505219
1700505220
1700505221 数据科学家养成手册 [:1700503517]
1700505222 数据科学家养成手册 4.3 使命必达
1700505223
1700505224 能说出“有问题”是第一个层次——定性;
1700505225
1700505226 能说出“问题在哪里”是第二个层次——定位;
1700505227
1700505228 能说出“问题的大小或数量”是第三个层次——定量。
1700505229
1700505230 古今中外,各行各业,尤其是手工业、工业、制造业,如果要发展,就必须做到低成本迅速扩张。如果要低成本迅速扩张,就必须做到标准化,然后以极快的速度、尽量低的成本对参与人员进行培训,或者以较低的成本用机器代替人的工作。这两种方式都有一个特点,就是要把那些必须由特定的人来完成的特定的高技巧性工作环节,简化为可以复制的且尽可能快速、低成本完成的工作环节。
1700505231
1700505232 数据科学家养成手册 [:1700503518]
1700505233 4.3.1 高效生产
1700505234
1700505235 标准化的好处显而易见——输入的内容是标准的,操作的内容是标准的,那么输出的内容就是标准的,这对输出成果的性状与预期一致有极高的保障作用。
1700505236
1700505237 以工人使用的机床为例,人们常说的“车钳铣刨”就是以前工人师傅的4个主要工种,即车工、钳工、铣工、刨工,他们都有对应的工具。例如,车工一般使用“车床”作为工具,铣工就用“铣床”,刨工就用“刨床”等。这些车床的使用全凭工人师傅手上的功夫。例如,使用车床的车工,主要是用车刀对旋转的工件进行车削加工,所有的尺寸都在车工的脑子里,所有的操作都由车工通过细腻的手法来调整,从而保证车出的零件光滑圆润。一位车工在上岗前通常需要经过大量的培训及至少几个月的实习,而在实际工作时,精神状态、情绪、疲劳程度等会使工作步骤、尺度把握出现偏差,从而产生一定的废品率。因为与生俱来的生理和心理特性,所以人类很难一直保持稳定的工作状态,不然也不会把这类工作称为“技术工种”了。
1700505238
1700505239 有了数控机床就大不一样了(如图4-26所示)。数控机床使用半自动或者全自动的程序进行控制,刀具使用的时间、角度、深浅都像复刻出来的一样,工作1次和工作10000次得到的产品完全相同。而且,机器不知疲倦,没有情绪影响,在工序复杂的零件加工方面,对效率的提升更加明显。据一些有经验的工人师傅说,对于一些简单的加工工件,使用数控机床能使工作效率提高3~5倍,而对于那些复杂工件,效率可以提升30倍甚至更多,且废品率极低。
1700505240
1700505241
1700505242
1700505243
1700505244 图4-26 普通铣床和数控铣床
1700505245
1700505246 我们来看一组数据。30多年来,中国的CPI(Consumer Price Index,居民消费价格指数)不断攀升,明显地反映了物价上涨的趋势(如表4-1和图4-27所示)。但是,我们每个人都能感觉到工业品价格的涨幅远没有这么明显,有些甚至在下降。
1700505247
1700505248
1700505249
1700505250
1700505251 图4-27 1979年至2014年CPI累加指数(11)
1700505252
1700505253 表4-1 1979~2014年中国CPI指数
1700505254
1700505255
1700505256
1700505257
1700505258 表4-1展示了1979年到2014年中国CPI指数的统计信息,图4-27则把指数累加值转化成了曲线图。从图表上看,1979年CPI累加指数为100,而2014年为584.1。也就是说,1979年价值100元的物品在2014年价值已经达到584.1元;或者说,2014年的584.1元在1979年只能当成100元使用。
1700505259
1700505260 就算不看这些数据,我们自己也会有感觉——这些年有些东西的价格上涨得特别快(例如农业产品),但是也有不少东西的价格确实在下跌。1983年,国内组装桑塔纳汽车的价格约为30万元,我们算一算这笔钱在2012年能“兑换”成多少元——大约是149万元。2012年,大众新桑塔纳的平均价格约为10万元,这笔149万元的“巨款”几乎可以买到15辆新桑塔纳!这种反差是十分惊人的。
1700505261
1700505262 为什么有这么大的差距呢?一个很重要的原因就是工业品生产能力的提高远高于CPI的增长速度。工业品为什么能有如此巨大的生产能力提升呢?其中很重要的因素就是生产技术的自动化,以及大规模生产线的使用,而更为重要的因素是标准化。这种标准化建立的基础就是期望用数字对生产条件进行约束,以达到生产条件一致,进而达到生产成果一致的情形。这种模型的稳定性对于资本的吸引力是明显的,也是巨大的——谁都喜欢这种算得明白、预期应验性高的买卖。要讨论为什么稳定性会有如此大的吸引力,就几乎等同于讨论在全社会范围内是劳动谋生靠谱还是买彩票谋生靠谱。我想答案不言自明——这不正是数据科学的成就吗?
1700505263
[ 上一页 ]  [ :1.700505214e+09 ]  [ 下一页 ]