1700511430
影响市场的因素非常复杂。人们购买一些东西,有的时候可能是受周围人的购入或卖出情绪的影响,有的时候可能是受新闻中释放出来的信号的影响。在华尔街有一句谚语:“市场是在爬一堵担忧的墙。”这句话主要应用在金融市场,大意是说,市场上都是由于某些担忧的情绪,才会去抛出一些风险高的产品,买入一些可以避险的产品。这种对于产品喜爱或厌恶的情绪通常体现在其他产品的供需上,产品价格的波动通常而且一定是由供需不平衡造成的。
1700511431
1700511432
市场情绪和其他我们能够感知的内容之间应该有着某种“客观存在”的联系,而大多数情况下的主要矛盾是我们对这些消息的获取能力很低,对相关维度的感知能力很低——无法获取这些数据,造成我们对市场行为的判断不准确。这也是没有办法的事情,因为建立模型的任务确实复杂到了一个人或者一个小型组织无法负担的程度——不知道拉普拉斯妖有没有这个能力,或许有。
1700511433
1700511434
当然,在一些情况下,市场对于某些商品的追逐确定性是比较高的。
1700511435
1700511436
我们以避险货币日元为例,由于其流动性好,所以在市场上出现一些风险事件的时候,日元往往会表现出大涨的现象。例如,“英国脱欧”、“苏格兰脱英公投”这种风险事件的消息一旦放出,短时间内会就看到日元有一波比较明显的上涨。
1700511437
1700511438
除了货币以外,其他商品同样拥有一些影响权重极大的信息维度可以让我们在不参考太多其他因素的情况下判断涨跌,例如房价问题。房价在中国也是一个非常复杂的问题,虽然在很多城市都有一些政策性的行为参与楼市调控,让人感觉预测起来非常困难,总是不知道“泡沫”有多大、哪里是拐点,但是房价的本质仍然是房屋的供需问题。一个城市的房价是上涨还是下跌,主要是当地外来人口的涌入速度和房屋建设速度较量的结果。三四线城市房价上涨乏力的原因是房屋建设太多,没有足够的外来人口支撑买盘压力。因为到三四线城市买房的人可能大都是周边乡村的人,如果这些人的就业问题无法在这些城市得到解决,房价的保持就根本无从谈起。而像北、上、广、深等大城市,只要外来人口持续快速涌入,而房屋的供应无法跟上,那么结果确实只有一个——房价一定有极大的上涨压力。而不知道“泡沫”有多少、哪里是拐点,原因无非就是没有掌握相关数据。一旦能够拿到相关数据,我们就可以用数据认知的方法来处理——“拟合”一下就可以对中短期的房价趋势作出相对准确的判断。至于长期判断应当如何做,真的不好说——谁让这个混沌的世界会不时地给我们带来一些意外呢?
1700511439
1700511440
1700511441
1700511442
1700511444
数据科学家养成手册 后记
1700511445
1700511446
这本书写到这里,就要和大家说再见了。掩卷长思,区区数万言也只能略略吹开数据科学的皮毛而已,距离揭示整个数据科学的方方面面还差得很远。如果在和你谈天说地的过程中,哪怕只有几个章节对你的工作有一丝提示,哪怕只有几句话能引起你对数据科学的共鸣,这本书都没有白写。这就是我作为一个在IT行业工作了十几年的“老兵”的心里话。
1700511447
1700511448
不管你是刚刚进入IT行业的新手程序员,还是在业内摸爬滚打多年的架构师,或者是转行不久的数据分析师,我想你在工作中慢慢会发现,所有IT职种之间的差别并不大,我们做的是同一件事——利用一切可以利用的软/硬件资源,用性价比最高的方式服务于我们所供职的公司和广大用户。这条路往前看不到尽头,往后也看不到尽头。
1700511449
1700511450
“路漫漫其修远兮,吾将上下而求索。”(1)这本书只是帮助各位读者做一些入门的准备,真正的修行才刚刚开始,我们需要解决的问题还有很多。记得我曾经跟要好的朋友开玩笑说:“趁着年轻,我们应该多动动脑、多动动手,难道你不想在变成一把炉灰之前的这50多年里多做一些不让自己后悔的事情吗?”
1700511451
1700511452
不要辜负我们的黄金时代。我也坚信,黄金时代一定不会辜负那些爱智求真的人!
1700511453
1700511454
(1) 出自屈原《离骚》。
1700511455
1700511456
1700511457
1700511458
1700511460
数据科学家养成手册 附录A
1700511461
1700511463
A.1 VMware Workstation的安装
1700511464
1700511466
A.1.1 VMware简介
1700511467
1700511468
VMware是由美国著名的虚拟化产品提供商VMware提供的虚拟化软件产品。它基于图形化管理,使用非常简单,对虚拟机指令的执行效率也非常高。
1700511469
1700511470
VMware提供了多个版本以应用于不同的场景。我们通常使用的是VMware工作站(VMware Workstation),这个版本主要用于个人计算机的虚拟机搭建。
1700511471
1700511472
安装VMware Workstation之后,我们可以在不破坏当前Windows环境的情况下使用资源隔离的方法再安装一个类似沙箱环境的Windows或Linux系统。
1700511473
1700511475
A.1.2 安装准备工作
1700511476
1700511477
1.硬件配置需求
1700511478
1700511479
在安装VMware之前,用户需要准备足够的磁盘空间和运行时所占用的内存。为了保证大数据软件流畅运行,请至少保证达到如下硬件配置。
[
上一页 ]
[ :1.70051143e+09 ]
[
下一页 ]