1703928963
第一,静态的数据被转化为动态的数据。云计算的出现使得储存动态复杂数据的技术能够更容易获得。
1703928964
1703928965
第二,层次化可重用设计。在数据高速公路中,共有6个层次,分别是数据发布层、数据可视化层、数据处理层、数据存储层、数据集成层以及数据建模层。实时获得的数据可快速地进行实时处理,再加上可重用的层次化设计,数据处理效率大大提高。可重用也就意味着云计算提供商可以在实现平台的同时,提供规模效应。
1703928966
1703928967
第三,传统的数据仓库转变为数据源。与传统的需要自建大型物理设备来存储数据的方式不同,数据高速路平台可以让企业将数据储存在云端,在保证数据的灾备安全的同时,使得数据的访问更为标准化、分布化。
1703928968
1703928969
金融投资的未来
1703928970
1703928971
在未来,互联网将云端的大数据分析平台的数据和分析能力送到了普通投资者的手边,技术不再是壁垒,普通投资者手中也能握有投资的利器,头脑好的投资者和团队甚至可以与机构同台竞争,为其自身或客户提供优秀的财富管理服务。
1703928972
1703928973
大数据技术下的量化投资作为服务让投资者能够科学、稳定地在全球市场投资。不远的将来,一大批靠天吃饭的共同基金经理和公司将被超越和淘汰,留下的基金公司将是那些能够根据大数据分析提供交易策略,占领独特优势的对冲基金和自营基金。
1703928974
1703928975
信息高速流转,市场中的机会会被量化交易策略快速地发现和捕获,金融市场也会变得更加有效,更加真实地反映由大数据所描述的现实。
1703928976
1703928977
新型金融服务的先驱者——阿里金融
1703928978
1703928979
互联网金融的先驱者阿里巴巴在金融创新方面可谓不遗余力。在阿里巴巴集团副总裁胡晓明看来,阿里金融的核心竞争力是其所拥有的大数据和云计算技术。
1703928980
1703928981
阿里金融提供的主要服务是为商户发放贷款。贷款主要分成两类:阿里贷款和淘宝贷款,前者针对阿里巴巴B2B平台上的商家,后者针对淘宝网和天猫上的商家。所有贷款都是订单贷款或者信用贷款,也就是说不像银行那样需要房产或其他抵押品。
1703928982
1703928983
除了对部分商家,阿里金融会派人采用视频调研加实地考察之外,大多数时候都是客户在线申请,阿里金融通过调用客户在阿里平台上的各种数据,建立各种各样的评分卡,决定是否放贷。客户也免去了传统银行贷款模式下提交各种烦琐材料的过程,节省了时间和金钱。
1703928984
1703928985
放款之后,阿里金融会通过支付宝等渠道监控现金流,避免客户违约。即便发生坏账,阿里金融经过各种催收之后,还有最后一招:清除客户在阿里巴巴平台上的账号和店铺。这些客户筛选和贷后管理措施帮助阿里金融在批量放贷的同时,不良贷款率始终保持在1%以下。这种对于贷款安全的良好控制,恰好也是新型金融服务平台的优势体现。
1703928986
1703928987
阿里金融手中握有每个客户在阿里巴巴生态系统,包括阿里巴巴、淘宝、天猫等的数据,这些数据通过阿里巴巴的大数据平台,成为阿里金融客户经理手中的撒手锏,相当于传统行业中,银行握有每个客户的真实账本、客服记录、客户关系、身份信息、核心银行账号(支付宝)、客户评价。客户经理可以用非常小的考察成本来了解一个申请贷款的客户。每个客户经理服务的客户数量是传统商业银行的15倍,平均每个客户经理每年能够服务300家企业。阿里金融的目标是把这个数字继续提高到3 000家,也就是说,不考虑企业规模,与银行的同行们相比,阿里金融的客户经理在同样的时间里,将能够为数量是前者服务量的150倍的客户放款,而且能保证这些客户几乎都不会赖账。在这种新型的金融服务模式下,客户可以享受快速、高效的贷款服务,贷款流程大大简化,足不出户,就能完成贷款的全部过程。
1703928988
1703928989
阿里金融的年化利率是18%,但由于用互联网方式放款,允许客户随借随还,按天计息,日利率通常是万分之五或万分之六。阿里金融提供的数据称,2012年全年,通过它们获得贷款的小微企业,实际付出的平均成本是6.7%,而银行一年期的贷款利率为6.1%左右,差别不大。
1703928990
1703928991
阿里金融发现了互联网企业独有的、金融机构不能全盘复制的价值。阿里金融希望利用大数据批量放贷,把阿里金融打造成一个可以流水线工作的现代金融服务工厂。
1703928992
1703928993
机器学习
1703928994
1703928995
互联网,特别是移动互联网造就了大数据,就好比高清电视替代普通电视,将实景中更多的细腻画面细节清晰地呈现在观众眼前。而随之产生的问题就是观众的普通视力是否可以捕捉到这些由于技术演进而增加的细节,充分享受技术革命所带来的全新视觉体验。假如观众视力不能有效分辨高清画面,那么高清摄像、播放和显示技术产生的意义对他/她而言就是非常有限的。而可以帮助解决这一问题的方法就是为观众配备提高视力的眼镜。对于互联网技术所推动的大数据而言,能够帮助数据用户增强“视力”的“眼镜”就是机器深度学习。
1703928996
1703928997
人工智能与机器学习
1703928998
1703928999
人工智能作为计算机科学的一个分支,专注研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统。而一般可以把人的智能概括为灵敏准确的感知功能、快速正确的判断功能以及恰当有效的执行功能。机器学习是人工智能的一个分支,就是通过预先设定好的学习规则——往往是计算机算法——使机器可以利用大量历史数据学习如何对研究分析对象进行有效分类或预测。由于人工智能的主要实现手段是机器学习,机器学习几乎成为人工智能的代名词。从20世纪80年代末期以来,机器学习的发展大致经历了两次浪潮:浅层学习和深度学习,两者的主要区别在于学习规则的目标和架构。
1703929000
1703929001
20世纪80年代末期,用于训练人工神经网络模型的反向传播算法的发明掀起了基于统计模型的机器学习热潮。在反向传播算法中,机器首先使用一个初始的神经网络模型对数据样本进行分类或预测(被称作“前向传播”),然后将分类或预测结果的好坏(激励响应)作为“学习反馈”,指导下一步对神经网络模型所进行的调整。通过这样自动实现的反复修正,使得神经网络模型可以快速和准确地“学习与掌握”数据样本中所包含的模式和规律。与传统的预测模型的估算方法不同的是,反向传播算法可以依据模型预测结果的好坏自动地指导模型结构进行调整。而传统的模型估算是在得出预测结果以后,由数据分析师人工决定如何调整模型,再重新进行学习。反向传播这种基于统计的机器学习方法比起过去基于人工规则的系统,在很多方面显示出优越性。这个时候的人工神经网络,虽然也被称作多层感知机,但实际上是一种只含有一层隐层节点的浅层模型。这个节点包含了如何使用既定的特征变量信息来对数据进行分类和预测的规则,而机器学习的目的就是要利用样本数据来确定这些规则。浅层学习也因此而得名。
1703929002
1703929003
20世纪90年代,更多的浅层机器学习模型相继被提出,比如支撑向量机、Boosting算法、最大熵方法等。这些模型的结构或带有一层隐层节点(如支撑向量机、Boosting),或没有隐层节点(如最大熵方法)。
1703929004
1703929005
2000年以来互联网高速发展,在商业领域为大数据的智能化分析和浅层学习模型提供了前所未有的应用空间。其中最成功的案例包括谷歌的AdWords(关键词竞价广告),百度的凤巢系统,雅虎、微软的搜索引擎和各类基于内容的推荐系统等。
1703929006
1703929007
2006年,加拿大多伦多大学教授杰弗瑞·辛顿和他的学生鲁斯兰·莎拉哈特迪诺夫在《科学》杂志上发表了一篇文章,提出了两个重要观点:第一,很多隐层的人工神经网络具有优异的特征学习能力,能通过数据样本学习得到更能对数据本质特征进行刻画的变量,从而更为有效地实现可视化或分类;第二,可以通过逐层初始化来克服深度神经网络在训练上的难度,以此开启了机器学习在学术界和工业界的第二次浪潮。由于这一次机器学习浪潮涉及多隐层神经网络,即深度神经网络,它也被称为“深度学习浪潮”。
1703929008
1703929009
自2006年以来,深度学习在学术界和应用领域持续升温。2013年4月,《麻省理工学院技术评论》杂志更是将“深度学习”列为2013年10大突破性技术之首。
1703929010
1703929011
今天谷歌、微软、百度等拥有大数据的著名高科技公司争相投入资源,占领深度学习的技术制高点。这些世界顶级计算机和互联网科技公司对于深度学习的高度重视并非偶然,恰是因为它们都看到了在大数据时代,更加强大的深度模型能真正有效揭示海量数据里所承载的复杂而丰富的商业信息,为创造新的服务产品和提高服务质量创造真正机遇,也为掌握这些技术的公司提供最为牢靠的竞争壁垒。
1703929012
[
上一页 ]
[ :1.703928963e+09 ]
[
下一页 ]