1700513611
机器人报道与假新闻
1700513612
1700513613
除了高度定制推送,今日头条也使用机器学习来创作与监管内容。2016年巴西里约奥运会期间,今日头条和北京大学合作开发了一名人工智能“记者”,可以在赛事结束后几分钟内撰写出简短的摘要报道。人工智能“记者”撰写的文章不怎么优美但速度惊人,有些赛事结束后两秒钟内,人工智能“记者”就完成了报道摘要,每天能报道30多项赛事。
1700513614
1700513615
算法也可以在平台上找出假新闻(通常是医疗类的假新闻)。起初,读者会发现并举报这类假新闻。后来今日头条使用这些带了标签的数据来训练算法识别假新闻。今日头条甚至专门训练一套算法来撰写假新闻,然后让两套算法相互较量,看谁能骗到谁,在相互学习中优化算法。
1700513616
1700513617
使用人工智能处理内容的商业模式回报颇丰,以此为基础的公司获得了天价估值。2018年7月,《华尔街日报》报道今日头条准备在香港上市,估值450亿美元。预计今日头条2018年营收在45亿美元至76亿美元。此外,该公司正快速拓展海外市场。2016年,今日头条收购美国著名的社交新闻网站Reddit未遂,一年后收购法国的一个新闻集合网站News Republic,以及由华人团队开发、广受美国青少年喜爱的对口型音乐短视频制作应用Musical.ly。
1700513618
1700513619
今日头条的成功展现了中国在互联网人工智能领域的实力。超过7亿互联网用户都在消费中文互联网内容。使用人工智能优化的在线服务使中国的互联网巨头获利颇丰,如腾讯在2017年11月市值超越Facebook,成为第一家市值超过5000亿美元的中国公司;如阿里巴巴快速成长,成为和亚马逊势均力敌的巨头。
1700513620
1700513621
我预测在5年后,中国科技公司在互联网人工智能技术发展和商业获利方面,会取得微小的优势。中国的互联网用户比美国和全欧洲加起来都多。而且移动支付的普及,使中国的互联网用户可以与内容创作者、O2O平台和其他用户无缝连接,支付行为非常简易。把这些结合起来,中国在开发互联网人工智能应用及盈利方面能够睥睨全球。再加上坚韧且资金充裕的创业者,中国很有可能(但是没有绝对把握)胜过硅谷。
1700513622
1700513623
不过,第一波人工智能浪潮创造的种种经济价值仍局限于高科技产业及数字世界。传统公司广泛地从人工智能发展中获利,是在第二波人工智能浪潮来临之后。
1700513624
1700513626
第二波浪潮:商业智能化
1700513627
1700513628
第一波人工智能浪潮的基础是给互联网用户的浏览数据贴标签,而商用人工智能则是给传统公司数十年来积累的大量专业数据贴标签,如保险公司理赔事故中鉴别保险欺诈,银行核发贷款时记录还款率,医院保存医疗诊断记录及患者存活率等。这些活动产生了大量带有标签,即自带特征及含义的数据。但直到最近才有部分传统公司找到方法,更有效地利用这些数据。
1700513629
1700513630
商用人工智能从这些数据库中挖掘人类往往会忽视的隐性联系,参考以往的决策与结果,利用贴了标签的数据训练算法,最终使其超越经验最丰富的人类从业者。这是因为人类通常根据强特征(strong features)来做出预测,而与结果高度相关的数据,通常是直接的因果关系。例如在预测患糖尿病的可能性时,此人的身体质量指数(BMI)是强特征。而人工智能算法除了会把这些强特征纳入考虑,同时也不放过其他的弱特征(weak features)——这些数据点可能表面上和特定结果无关联性,但是把数千万个例子结合起来后,可以发现一些对预测结果有帮助的重要联系。这些细微的关联性往往没人能解释清因果,例如为何在星期三取得贷款的借款人往往能较快地偿还贷款。但是,使用人脑难以理解的复杂数学关系,把许多强特征和弱特征结合起来的算法,能在许多商业分析工作上胜过技术顶尖的人类。
1700513631
1700513633
商用人工智能事业
1700513634
1700513635
早在2004年,帕兰提尔(Palantir)及IBM沃森等公司就已经为企业与政府提供大数据分析服务。那个时期的商用人工智能应用高度集中在金融业等少数几个靠高度结构化信息运作的产业。“结构化”的意思是已分类、贴上标签、可搜索的数据,最典型的就是股价历史信息、信用卡使用记录等。这类产业有明确的优化指标,与人工智能天生契合。
1700513636
1700513637
因此,传统产业发达的美国在早期的商用人工智能应用领域建立了强势的领先地位。大型美国企业收集了大量数据,设计了良好的储存结构。它们常使用会计、存货管理及顾客关系管理等领域的企业软件。有了这样结构化的数据,如帕兰提尔这样的数据分析公司可以很容易地将人工智能商用,帮助传统公司优化现有数据库,更好地识别欺诈、更明智地进行交易、发现供应链上缺乏效率的环节,使得企业进一步节约成本,利润最大化。
1700513638
1700513639
中国的企业大多使用自己特有的系统来保存数据,从未真正接纳企业软件或标准化的数据储存。这些系统无法扩展,难以和现有的企业软件整合,数据的整理与结构化非常困难。无结构的数据导致使用人工智能优化后的结果不甚理想。另外,中国公司在雇用第三方顾问服务方面的支出远少于美国公司。中国许多传统企业的经营模式和企业文化仍然像个体经营而不是现代企业组织,它们认为不值得在第三方的专业服务上花钱。
1700513640
1700513641
到了2013年,深度学习技术的应用大大提高了服务水平,市场上出现了新的竞争者,如加拿大的Element AI、中国的商用人工智能公司第四范式。
1700513642
1700513644
炒掉银行客户经理
1700513645
1700513646
中国大部分传统企业普遍存在数据尚未结构化、企业文化老旧等现象,使其难以在第二波人工智能时期享受技术红利。但一些能够直接接入商用人工智能的产业在大步前进,小微金融就是其中最有前景的一个产业。过去中国的金融服务业以人力为主,小微金融产业成为直接采用尖端人工智能应用的一块跳板。
1700513647
1700513648
微信和支付宝可以让你直接从银行账户转账付款,但它们的核心服务无法让你在收入到账之前,稍微透支一部分。这是因为当金融服务商越过信用卡直接进入移动支付时,无法同步利用信用卡发行商的信用数据。面对这样的问题,智融集团(Smart Finance)研发的人工智能应用填补了这块空白,它只依赖算法,就可以评估贷款的风险,并做出比人精确的判断。它不要求申请人填写收入水平,只要求用户同意发贷方从他们的手机上取得一些数据。这些数据就像申请人的数字指纹,能够以相当高的准确度预测他们有没有能力偿还1万元的小额贷款。智融的深度学习算法不只看明显的指标,如用户的微信钱包里有多少钱,它也根据一般银行贷款审核人员认为无关紧要的数据点来做出分析,如用户输入出生日期的速度、手机电池还剩多少电量以及数以千计的其他数据。贷款申请人的手机还有多少电量跟他们的信用有关系吗?这两者间不是“因为……所以……”的因果关系,而是因为人类难以识别的海量数据中隐藏着关联性,这正是人工智能擅长的领域。智融用数百万笔贷款数据来训练算法,这些贷款有些偿还了,有些则没有,发掘了和信用相关的数千个弱特征。智融集团创始人兼CEO焦可把这些不寻常的指标形容为审核放款时的“新审美标准”(2) ,取代了个人征信之类的传统标准。
1700513649
1700513650
不断增加的海量数据使算法不断优化,也使智融能够将信用服务延伸至那些向来被传统银行忽视的人群,如低收入年轻人及外来务工人员。智融集团的人工智能算法,预测违约率低至个位数。这一数字让传统银行叹为观止。
1700513651
1700513653
请到算法诊所就诊
1700513654
1700513655
商用人工智能并非只能用在跟钱有关的领域,它同样可以用在数据驱动的公共服务上,让许多之前负担不起这些服务的人享受科技带来的红利,促成高质量服务大规模推广。这方面,最具前景的领域之一是医疗诊断。美国的顶尖研究人员如吴恩达和塞巴斯蒂安·特伦,已经展示了一些依据影像在诊断某些疾病时媲美专业医生的一流算法,如根据胸部X光片来诊断肺炎,根据照片来诊断皮肤癌等。不过,医疗领域商用人工智能的更广泛应用,将有望处理多种疾病的整个诊断流程。
1700513656
1700513657
目前,拥有专业医学知识以及能为患者做出正确诊断的人仍然以少数专业人士为主,但他们精力有限,记忆力也不能支持他们记住所有的病例与治疗方法,一流的医疗服务仍然由为数不多且资金充裕的医疗机构提供。互联网上虽然散布着海量的医学信息,但并不是以大众能够理解的形式存在。在人口众多、医疗资源相对紧张的中国,训练有素的医生大多集中在大城市的一流医院,在偏远的城镇或乡村,医疗资源并不是很丰富。因此,中国各地的病患总是想尽办法到北京、上海的大医院看病,哪怕需要等很多天。这让大医院本就有限的资源更加紧张。
1700513658
1700513659
第二波人工智能浪潮有望改变这一切。疾病诊断涉及的数据(如症状、医疗史、环境因素等)以及从与这些数据有关的现象(如某种疾病)中寻找关联性并做出预测,这些工作正是深度学习擅长的。有了足够的数据——精准的医疗记录,由人工智能驱动的诊断工具能够把一般水平的医疗专业人员变成处理过数千万个病例的超级医生,还能发现患者症状数据之间隐藏的关联性,同时还有完美的记忆力。
[
上一页 ]
[ :1.70051361e+09 ]
[
下一页 ]