打字猴:1.70353498e+09
1703534980 许多关于拉多普洛斯的故事要追溯到20世纪90年代早期,那时他还是一个声名狼藉的黑客。在那个年代里,成为一名黑客是一件非常酷的事。顶尖的黑客能够拥有像摇滚巨星一样的地位,受众人膜拜。他曾经一起合作过的同事确实有着像摇滚明星一样的名字:Phiber Optik、腐败者、反叛者、瘟疫、迷你君王[2]。
1703534981
1703534982 拉多普洛斯在网络上被人称为犀利飞客。20世纪80年代末,他在纽约成立了一个精英黑客组织,称为骗局大师。该组织专门入侵电话系统,这一技术也被称为“飞客技术”。这也是拉多普洛斯别名的由来。
1703534983
1703534984 骗局大师对电话截断技术了如指掌。他们入侵了许多相关的系统,最终引起了联邦政府的注意。成功入侵AT&T公司的电话系统之后,拉多普洛斯和他的伙伴保罗·斯泰拉于1993年7月被指控犯罪,最终以“合谋进行计算机犯罪”为由被判入狱服刑6个月以及居家监禁6个月。
1703534985
1703534986 出狱后,拉多普洛斯找工作并未遇到任何困难。他的才能得到了众多公司的赏识,这些公司急需应对飞客攻击的技术。起初,他在一家军事情报机构担任计算机系统安全分析员。后来,他开始研究股票市场相关的技术。最终于1996年,他在极讯公司担任全球信息安全部主任一职。
1703534987
1703534988 1998年,他认识了纽约基金巨头德劭基金的传奇创始人戴夫·肖恩。德劭基金采用数学和计算机技术从市场上获得数以亿计的年利润。戴夫·肖恩进入金融市场之前,曾是哥伦比亚大学计算机科学教授。这位大学老师说服拉多普洛斯说,华尔街的大笔财富并不在“安全系统”之内,这些钱都可以通过计算机模型从股市上挣得。
1703534989
1703534990 拉多普洛斯花了好几年才掌握能用于现实的建模方法。为了能够更好地研究金融市场,在极讯公司任职期间,他在纽约城市大学学习经济学。接下来,2000年年初,他认识了大卫·雷恩韦伯,加州大学伯克利分校的金融学教授。雷恩韦伯从事将人工智能用于交易的研究已经有十多年了。
1703534991
1703534992 从20世纪90年代起,拉多普洛斯开始学习人工智能,但是他一直不相信这项技术能用在股票交易上。雷恩韦伯则告诉他,随着计算机的运算能力越来越强,互联网上的数据也越来越多,人工智能算法最终会成为预测市场未来走向的可靠方法。他们一度成立了一家技术公司,叫作监控者110。他们从深网[3]上检索对冲基金和银行自营交易员可能用于交易决策的信息。公司将特殊的搜索引擎安装在华尔街北边,一座建筑物的六层阁楼上。因此,公司可以检索到超过900个信息源,包括传统的新闻网址和博客。这些信息涵盖了众多公司,以及从制药技术发展趋势到石棉诉讼案[4]等市场热门话题。拉多普洛斯带领的研发团队负责交易策略的测试。测试的目的是为了检验交易策略是否能适应各种不同的市场状况,就好比是制造一台自动贩售机,以应对各种不同用户的潜在需求。
1703534993
1703534994 在监控者公司,拉多普洛斯结识了公司核心创始人罗杰·艾伦伯格,一位风险投资人,曾经经营着德意志银行内部一个规模达60亿美元的基金。同时,艾伦伯格也是著名的文艺复兴科技公司的长期投资人。他也清楚地认识到使用大量数据和人工智能算法交易的巨大潜在收益与挑战。这是可能实现的,但只有最聪明的人才能够驾驭这种技术,例如文艺复兴科技公司的鲍勃·默瑟和皮特·布朗。
1703534995
1703534996 虽然汇集了世界一流的聪明才智,但监控者公司还是失败了。这个尝试无疑是大海捞针,远比想象中的要艰难很多。各种信息源源不断地涌向计算机,庞大的数据量和纷繁复杂的类型使得人们很难从中找到黄金。公司于2008年一度搁浅,拉多普洛斯的团队也就此解散。
1703534997
1703534998 几年之后,原先解散的团队发展壮大成了动力基金。拉多普洛斯、艾伦伯格以及其他几个团队成员认为,当初他们创立监控者公司的核心想法依旧有着巨大的潜力。
1703534999
1703535000 技术正在飞速发展。云计算机能够充分使用分布式网络中的闲置产能,这使得众多公司拥有了足够的电子运算能力来应对庞大的数据量。监控者公司购买并建造了自己的服务器机群,这让公司能够在云端进行更为高效和低成本的运算。语言处理和人工智能算法的跨越式进展也使得公司设定的目标变得更为切实可行。
1703535001
1703535002 最大的挑战来自于:如何缩小数据规模。信息高速公路上拥堵了不计其数的数据,可供交易系统使用。现在的问题是数据太多了!他们需要的是更加优质的信息。这些优质的信息要能共同输入到模型当中,并能够战胜市场。假如在整个网络中检索信息,那就好比是想煮沸整个大海。因此,他们缩小工作量,使得计划变得更容易实现。
1703535003
1703535004 他们建造了一个各种网页和其他可以机器读取的网络资源数据库,包括了证监会以及其他政府机构网址。为了解读这些信息,拉多普洛斯和其他程序员开发了一个人工智能程序。该程序能够自动监控网页动态,找出可识别的信息,并为股票交易提供特定的预测。系统可以追踪特定股票的相关信息,例如与苹果公司有关的Mac Rumors、工业界专家的最新言论、中国的船运数据(iPhone大部分在中国生产)、招聘网站上有苹果公司工作经历的求职者数量(该数字提升说明公司开始裁员,这很可能是公司经营不当造成的)。系统也能够检索到SEC的档案、Amazon.com的各种数据以及其他的零售商网址,这些信息能够帮助分析公司销售表现,甚至系统也可以分析推特上提及苹果产品的即时动态。
1703535005
1703535006 人工智能程序像一台充满魔力的研磨机处理加工所有信息,最后计算出特定概率的购买或卖出的建议,就像华尔街的分析师或者IBM公司的沃森一样。这样的系统至少理论上是能够实现的。
1703535007
1703535008 拉多普洛斯希望达到的目标是:在公司公布消息之前,能够准确预测公司的业绩。更准确地说,他们是希望利用人工智能方法来模拟一个金融分析师。理想状况下,动力基金甚至能够比公司内部的高管和雇员更早知道公司的财富水平变化。公司的销售量变动趋势、实际产量、来自竞争对手的价格战争——一旦你掌握了这些数据并充分解读它们,这些都将成为窥探未来的水晶球。
1703535009
1703535010 2008年,带着对大数据的无限憧憬,拉多普洛斯、艾伦伯格和一个由科学家、程序员、数学组成的小团队发起成立了动力基金。他们希望能够在2011年前正式上线一套人工智能交易系统。这个系统将只在罗素2000指数中挑选股票,该指数涵盖的成分股都是小盘股,华尔街的分析师一般较少关注这些股票。由于在小盘股上的竞争不那么激烈,因此,拉多普洛斯认为,这些股票是容易实现获益的投资标的。
1703535011
1703535012 较少的竞争也意味着市场上这些公司的信息较少。对于交易系统,这可能是一件好事。因为系统不必花费太多时间和运算量在筛选信息上。但是,较少的信息也可能是一件坏事。市场上也很少人会去议论迈达斯公司或者对士丹利家具的业绩发表看法。这两只股票均是罗素2000指数的成分股。哪怕是缩小了数据规模,机器为了描摹出某个公司或板块的实际状况,依然需要处理的大量的数据。
1703535013
1703535014 虽然是从一个较小的数据池中处理处理,但这还是属于大数据的范畴。
1703535015
1703535016 ■■■
1703535017
1703535018 动力基金的数据供应商之一Selerity技术公司,该公司开发了一个可供人工智能计算器快速获取和解读上市公司业绩报告的新闻检索系统。Selerity的算法将会处理财务报表数据,同时会找出危险信号,比如隐藏在脚注中的巨额损失。一旦出现“破产”“违约”“合并”等关键词时,会在毫秒之内向动力基金的交易机器发出警告。
1703535019
1703535020 这样的交易方式有时能带来大量的财富。2011年1月,Selerity根据微软发布盈利报告的历史网址,成功破解了微软公司下一次发布盈利报告的网址。在美国东部时间下午2点50分,盈利报告突然出现在被破解的网址上,但是,微软还没有将网址公布在网上,他们认为市场还不知道盈利报告的内容!微软公司错了。Selerity瞬间将消息从网页上下载,并将内容发送给了客户。人工智能计算机迅速做出反应,在一瞬间获得了利润!
1703535021
1703535022 在那时,动力基金的交易系统并没有上线运行。实际上,他们还需要解决一大堆的难题。原本计划于2011年2月上线的系统还没有准备好。程序员和拉多普洛斯还在不停地调试系统。他们输入的数据越来越多,希望机器能够找到隐藏在大数据之中的宝藏。
1703535023
1703535024 公司内部就风险控制和输入变量的使用展开了激烈的争论。需要解决的问题像一座座大山一样挡在面前。他们却无可奈何,事倍功半。动力基金团队夜以继日地工作着,休假成了一件十分奢侈的事情。
1703535025
1703535026 公司在开发系统时,有一个非常坚定的信念:机器永远是正确的。一个难题摆在动力基金面前:如何给不同的策略命名。这很困难,因为人工智能算法会随着时间推移而不断改变。一个策略在某个月会选择便宜的股票,到了下个月可能会去追逐价格处于高位的股票。
1703535027
1703535028 “对此,我们必须特别小心。千万不要被模型的名字愚弄了。名字只是我们给的一个记号,不必过分纠结,”一个动力基金研究员在一封发给其他团队成员的邮件中这样写道,“比如,假设我们认为某个策略能很好地捕捉动量带来的收益。要是用投资组合的数据来验证这个策略。很可能出现的情况是:一旦某个时段,资产组合的动量特征消失了,我们将遭受较大的损失。这给我们设计模型带来了一些挑战。”
1703535029
[ 上一页 ]  [ :1.70353498e+09 ]  [ 下一页 ]