1700510227
如图16-15所示,设针与距离其最近的直线的夹角为θ。取针的中点,并以该中点向距离其最近的这条直线做垂线段,长度为x,则有
1700510228
1700510229
1700510230
1700510231
1700510232
1700510233
1700510234
1700510235
图16-15 相交的情况
1700510236
1700510237
1700510238
1700510239
1700510240
当时就会相交。由于针的位置是随机的,所以x在上服从均匀分布,θ在上也服从均匀分布。这个时候的π是未知数,是根据弧度的定义写出来的。这里我们又一次看到了求不规则图形面积的思路。如果想求曲线
1700510241
1700510242
1700510243
1700510244
1700510245
在平面直角坐标系(θ, x)上的面积,那么仍然是一个产生随机点求个数比的问题。
1700510246
1700510247
如图16-16所示,阴影部分与整个面积的比例p可以写作
1700510248
1700510249
1700510250
1700510251
1700510252
所以得到
1700510253
1700510254
1700510255
1700510256
1700510257
1700510258
1700510259
1700510260
图16-16 求解面积问题
1700510261
1700510262
真是精巧绝伦。
1700510263
1700510264
在本节的案例中,一些利用统计原理来做的工作看似简单,却蕴含着深刻的数学原理。这些既利用随机原理又能得到想定结果的方式,非常值得我们关注。在拥有足够的基础理论知识后,这些技巧使用起来将会如鱼得水。数据分析是一个厚积薄发的工作,关键在于不断积累和总结。
1700510265
1700510266
1700510267
1700510268
1700510270
数据科学家养成手册 16.7 仁者见仁,智者见智
1700510271
1700510272
算法是死的,但人是活的。在使用算法进行计算的时候,人们可以进行参数的设定。计算出来的数据结果,也要靠具备不同知识背景、业务水平和分析能力的分析师来解读。所以,作为一名优秀的分析师,会写算法、了解算法的运算过程仅仅是入门,真正困难的是如何用辩证的观点去看待这些计算出来的数据并进行合理的阐释。
1700510273
1700510274
在数据分析环节,我们又一次见到了由人的主观看法大量介入的不可避免的事实。只要是有人参与的环节,都难免会产生“条件相同,但结果不同”的情况。人作为一种极为复杂的“分类器”,其微观行为都是难以捉摸的。所以,即使是同样的数据,不同的人也会分析出不同的结果,进而导向不同的决策——这也不是什么奇怪的事情。我们都听说过,很多大公司,甚至是有上百年历史、上千亿资产的大公司,由于各种原因产生决策失误,最后走向倒闭、被并购等令人叹惋的结局。不要以为这些大公司的数据分析人员和决策人员都是无能的白痴或者骗子,仅仅是因为他们的错误才导致公司走向衰亡。我们必须清楚一点:人类对未来一直都是充满敬畏的,其中重要的原因是未来对人类而言都是不可知的,没人能知道下一刻会发生什么,就更别说5年甚至10年以后会发生什么了。就好像我们开车去一个遥远而陌生的地方,即使打开导航和GPS定位并采用躲避拥堵模式,就肯定能躲开所有的拥堵路段吗?你能确定在途经的某个只能通过一辆车的路口没有突发的事故吗?这个比喻要表达的意思已经非常明确了。
1700510275
1700510276
对于数据分析,也只能直面这个悲观的事实:人的认知能力是有限的,对于越远期、越微观的事物,人类的把握能力越弱。从数据分析师的职业道德角度来说,恪守以数据为本的原则,认真处理数据,基于自己最大的认知能力解读,说实话,认真听取其他拥有不同知识背景的分析师的观点——就够了。这是对自己工作的尊重。不必太在意分析是不是面面俱到、会不会出错——没有人能保证自己的分析与客观世界一致。数据科学只涉及认知边界内的量化知识,如果想尽可能做到一致,那就努力开拓自己的认知边界吧。
[
上一页 ]
[ :1.700510227e+09 ]
[
下一页 ]