打字猴:1.70392829e+09
1703928290
1703928291 投资是对真实世界的理解。但是,投资分析如果连真实世界都看不完全,一叶知秋的理解力又从何而来?大数据让我们得以窥见事物的全貌,防止以点带面、以偏概全的认知误区,使投资更接近于“圣杯”[1]。
1703928292
1703928293 抛弃因果,寻找相关
1703928294
1703928295 人类对事物之间的联系分因果与相关两个维度,但相关是一切的前提。相关可独立于因果而存在,因为除因果关系的相关之外,还存在简单相关和时序相关。拿沃尔玛搭售尿布与啤酒的案例来说,这种相关关系的存在不是因为婴儿需要啤酒,而是背后有“超级奶爸”这个群体。这种购物篮里的相关就是简单相关,我们没有深究它的必要,它也不能放之四海而皆准,但是有重要的应用价值。《怪诞行为学》一书中介绍了一位饭店顾问,专门琢磨菜单定价与顾客消费的关系。他发现了件有趣的事情,就是主菜的价格定得高,饭店的效益将更好,原因是价格贵的菜没人点,价格便宜的菜反而好卖。你只要利用这个秘密赚钱就好,不用聘请心理学博士,去分析顾客们翻开菜谱时的复杂心理。
1703928296
1703928297 与因果关系不同,相关关系在人类社会广泛存在。六度分隔理论认为,任何两个人都可经过6个中间人产生联系。这下你可以理解,为什么人与人之间的联系被叫作“关系”。互联网从1.0到2.0版(移动互联)的飞跃,为人类提供了无限相关的可能性。“互联”二字的真意,是超越空间与时间,将不同的人、不同的物和不同的事关联起来。
1703928298
1703928299 大数据是人、事、物之间的多重耦合,复杂程度超出人类以往的经验、直觉。在纷繁复杂之中找出两个事物的关系,必须先去挖掘变量间的相关性。而且,人类思维由因果转向相关,也有对成本和收益的权衡。一方面,找相关更有效率。因为挖掘变量之间的相关关系,我们拥有度量和算法上的优势,可以交由智能化的机器处理,比挖掘因果关系更省时、省力。另一方面,盯住相关关系的收益显著。如前面所举的例子,有因果的相关关系可以赚钱,没有因果的相关关系也照样赚钱。
1703928300
1703928301 证券世界的相关无处不在,甚至可以说,相关关系是证券投资理论的基石。芝加哥大学金融学教授约翰·科克伦所提出的基于消费的资产定价模型为所有资产建立了一个“相关”关系的大图景。他认为,投资者有平滑消费的动机,与未来消费呈正相关的资产(更形象地说,是“锦上添花”型资产),因投资者天然厌恶而定价较低;与未来消费相关度较低的资产,其定价会相对较高[2]。诺贝尔经济学奖得主马科·威茨于20世纪50年代提出的现代投资组合理论,就是利用证券之间高低不等的相关关系,实现投资收益与风险目标的优化。在实践方面,投资界对基金经理进行考核,将他们管理组合的业绩表现分解为Alpha和Beta,划分依据也是其投资业绩与市场的相关度。
1703928302
1703928303 尽管相关关系是投资分析的基础,但是长期以来,投资者对因果关系更为专注。比如,大多数证券分析师从事基本面分析,他们每天都在为行业和股票的涨跌找原因、定空间。基于价值和方向判断的投资思维和方法,也在投资领域中占有重要地位,无论是自上而下采取宏观策略的索罗斯,还是自下而上找企业的巴菲特都信奉此道。但是,华尔街还流传这样一句名言:一个好的操盘手是一个没有观点的操盘手。《信号与噪声》中也写道:“市场是最好的预测。”这两句话是告诫投资者,不应事先假定股市会朝哪个方向走,不要做方向性的预判,而是让投资跟随市场,如此才能避免因误判方向而带来的风险。
1703928304
1703928305 抛弃价值或者方向判断,相关关系对投资或许更有用。预测股票涨跌的分析师貌似对基本面的因果分析很在理,但估值还得看行业、市场与历史区间,这实际上也是相关分析。更令分析师尴尬的是,某些时候股票涨跌真的没有原因,可能是由于“羊群行为”、动量或者惯性效应等引起的,你总不能将它解释为“因为上涨(下跌)而上涨(下跌)”,虽然事实可能的确如此。
1703928306
1703928307 预测公司的算法交易
1703928308
1703928309 《连线》杂志主编凯文·凯利在其《失控》一书里,引用了戴维·拜瑞比关于可预测性的一个比喻:现实的市场躁动得如同一条湍急的河流,满是狂野的波浪与旋涡,但是只要熟悉一个水流旋涡,你就能知道河流在5~10秒的流向。预测公司[3]就擅长运用算法去抓住市场的小旋涡,从小趋势中赚钱。预测公司的创始人法默和帕卡德认为,他们只关注寻找获利的交易模式,至于该模式为何产生是经济学家们的问题。法默认为预测公司的业务已经证明,与人相比,机器是更好的预测员,而算法是比米尔顿·弗里德曼更好的经济学家,现在的交易员已经感受到了机器的威胁。狗不学算术,照样可以精准地接到飞盘,说明直觉、聪明是预测最好的武器。法默坦言,金融预测不是他的长期目标,他们只是想创造预测机器去预测更多的事情,包括气候、传染病或者其他目前还不能搞定的数据。
1703928310
1703928311 基于相关关系的投资思维在实践中已取得成功。文艺复兴科技公司堪称对冲基金界的翘楚之一,这家公司的核心竞争力是拥有多位科学家、数学家,即不要从事基本面分析的经济学家和财务研究员,这与传统意义上的资产管理公司的标准配置不同。该公司的创始人西蒙斯关注的就是相关性,而不是因果关系。换句话说,是与“亚马孙河上一只蝴蝶引发太平洋风暴”类似的相关性。其他常见的量化投资策略,诸如套利、事件和动量等,也是根据证券之间、证券与事件之间、证券跨期收益之间的相关关系构建投资组合。所以,不必为抛弃因果而沮丧,从相关关系出发的投资同样可以挣钱,甚至比其他方法更挣钱。
1703928312
1703928313 更加注重相关性,对投资风险的防控也有积极意义。马科·威茨的“均值–方差”模型阐述了投资组合的分散性,处理的是证券之间的相关关系。投资经理在构建证券组合的过程中,是否纳入一只股票,除定性认可它的投资价值之外,还要考察该股票与整个组合的相关性,看它是增加还是降低了组合的总体风险。美国对冲基金桥水公司有只久负盛名的“全天候基金”,意思是不论市场涨跌,它都能获得稳定收益。这是要求极高的技术活,资产配置与风控能力缺一不可。据桥水公司老板雷伊·达里奥介绍,该基金进行资产配置与风险控制的着眼点,就在于规避资产类别之间的相关性。
1703928314
1703928315 动态预测
1703928316
1703928317 时效性是大数据的生命,也是将其与传统统计分隔成两个世界的屏障。传统统计缺乏实时和高效的处理手段,从数据采集、整理、加工到分析,整个过程费时费力,等到分析结果出来,发现“萧瑟秋风今又是,换了人间”。国家统计局局长马建堂曾为基层的统计调查队撰文,题目是“她们纯朴的眼中为什么总是流淌着泪水”。其实,我们了解她们的难处,这种苦活、累活、憋屈活在大数据时代将告别历史舞台。
1703928318
1703928319 缺乏前瞻性是传统统计缺点的集中体现。列宁曾提出用统计管理经济。他曾说过,“每一种商品、每一磅粮食都应被统计到。”大家不用怀疑苏联统计工作的严谨程度,但计划经济并不可行。计划经济时代的数据采集频率过低,经济动态难以为决策层实时把握,经济计划不能因时而变,整个经济体制缺乏弹性,这些都是原因。
1703928320
1703928321 现在的官方统计也存在这个毛病。经济指标的采集和发布频率过低,比如GDP以季度频率公布,工业增加值、PMI(采购经理指数)、CPI等数据以月度频率公布。加上发布时滞,投资决策只能“看着后视镜向前开”。但在《战胜华尔街》一书中,彼得·林奇提到的第4条林奇投资法则,就是“你无法从后视镜中看到未来”。所以,盯着这些滞后的经济数据,你注定不能像彼得·林奇那样成功地投资。
1703928322
1703928323 时间对证券投资而言,就是一切。下单比别人晚一秒,你就会有所损失,因为其他投资者的高频交易速度已发展到微秒的地步。而且,新信息对市场的冲击,可能就发生在一瞬间,如果能抢跑几秒,你就能获得先人一步的优势。同样,政策制定者盯着这些“后视镜”般的宏观数据,可能会做出灾难性的决定。2011年10月,因为滞后的经济数据显示良好,即使美国和其他重要经济体步入衰退,欧元区经济下滑几成定局,特里谢领导的欧洲央行仍然选择观望。政策“慢半拍”把继任的德拉吉行长急坏了,他上台两个月两次降息,但欧元区经济已无力回天。
1703928324
1703928325 快速采集、快速分析、实时预测未来,这是大数据的应用之道。而投资本身就是一场与时间的赛跑,对信息进行搜集、分析和处理的速度,或许是决定投资成败的唯一因素。由此看来,大数据对于投资的影响,是它将带来又一场信息变革,促使金融市场对信息的处理速度不断提升。桥水的灵魂人物达里奥就是一位与时俱进的高手。他将经济视为一台机器,这台机器的运行规律是其从下到上构建的宏/微观经济模型,据说由上万个经济方程构成。桥水搜集经济数据的体量及对数据的细化程度,甚至高于美联储。现在,根据实时更新的微观数据,桥水可以监控多个国家的经济运行,以及多个资产市场的成交变化,为投资决策的制定、调整提供实时指导。
1703928326
1703928327 对信息获取、分析以及反应速度的极度追求,已促使国外某些对冲基金采用文本驱动的交易程序。它们利用计算机实时扫描、监测主要媒体的关键词,为在重要事件发生之际,获得抢跑数秒甚至数微秒的交易优势。据《华尔街见闻》报道,在2013年4月24日那天,叙利亚黑客入侵了美联社的Twitter账户,发布了白宫爆炸、总统受伤的虚假消息,一瞬间引发美股道琼斯工业指数下挫约130点,发现上当之后,市场又迅速收复了失地。这场“无厘头暴跌”从侧面说明,现在的证券市场对信息的反应何其灵敏。
1703928328
1703928329 草根数据有力量
1703928330
1703928331 大数据来自互联网、移动互联网,继承了互联网开放、分享、合作的基因。如果说以往的经济统计和数据发布是官方行为、权威的象征,那么大数据统计无任何权威的加持,它纯属企业或其他组织的民间行为。大数据时代的统计既不需要基层调查队,也不需要顾虑社会影响而调整数字,更不会给出31大于31的GDP算术题。尽管与官方数据比,大数据确实粗糙,但它的真实性足够弥补这一点。
1703928332
1703928333 传统统计除时滞以外,还存在抽样设计、参数调整与现实脱节的毛病,这都将损害官方数据的权威性。比如,社会大众较难接受CPI,因为与他们的主观感受不符。证券机构的经济学家对CPI同样存有疑虑,但还能将就着用。因为证券机构的共识是不看绝对看相对,可以透过CPI的变动看物价走势。
1703928334
1703928335 还有些人不堪忍受,不愿将就,他们转向了大数据。据媒体报道,麻省理工学院斯隆管理学院的两位教授启动了一个名为“百万价格工程”的研究项目,计划在网上搜集不同国家零售商品的价格,编制各国“在线价格指数”,以此解救饱受官方CPI“虐心”的各国群众。马云领导的阿里巴巴早前根据淘宝的交易数据,在2008年7月推出了中国首个网络购物消费指数:淘宝CPI,其后又将淘宝与天猫的海量交易数据进行合并,于2012年8月发布了阿里iSPI指数(网络零售价格指数)。国内其他互联网公司,如百度、新浪等,也接连推出在线数据统计服务。需要强调的是,互联网企业推出的在线统计在某种程度上不仅仅是官方统计的替代,更是全面超越,因为它能搜集和反映更多的社会信息。新浪微博数据中心提供的实时热词,完全根据微博的关键词统计,可反映社会大众的普遍关注。比如,2013年1月1日的热词是“史上最严交规”,1月18日的是“我是歌手”,3月9日的是“黄浦江死猪”,4月3日的是“海天盛筵”,5月2日的是“大黄鸭”,6月27日的是“小时代”,这些词完全实时地反映了网络大众的眼球转动。
1703928336
1703928337 大数据时代的统计:阿里iSPI指数
1703928338
1703928339 iSPI(internet Shopping Price Index),由阿里研究院于2012年8月正式推出。据阿里巴巴介绍,该指数的编制目的,是综合反映阿里巴巴旗下淘宝和天猫两大网购平台的网络零售交易商品和服务的一般价格水平。该指数包括两个系列:(1)iSPI总体物价指数系列,反映一定时期内网络零售商品和服务的总体价格变化,即网络渠道购买一篮子商品和服务的成本变动;(2)iSPI总体物量指数系列,反映去除物价变动因素后,一定时期内网络零售交易实物量的总体变化,即网络渠道实际消费量的变化。
[ 上一页 ]  [ :1.70392829e+09 ]  [ 下一页 ]