1700541420
1700541421
图14.32 罗塞塔石碑
1700541422
1700541423
统计机器翻译模型从平行语料中挖掘出不同语言的词语间的对齐关系,基于对齐关系自动抽取翻译规则。一个经典的统计机器翻译模型通常包含翻译模型、调序模型和语言模型三部分。翻译模型负责估算单词、短语间互相翻译的概率,调序模型对翻译后的语言片段排序进行建模,而语言模型则用于计算生成的译文是否符合目标语言的表达习惯。统计翻译模型减少了人工参与,模型本身和训练过程具有语言无关性,大大提升了机器翻译的性能和使用范围。
1700541424
1700541425
近年来随着基于神经网络的方法被引入机器翻译领域,机器翻译的性能得到了大幅提高。根据谷歌机器翻译团队发布的信息,谷歌翻译于 2016 年 9 月上线中英神经网络模型,截至 2017 年 5 月,已经支持 41对双语翻译模块,超过 50% 的翻译流量已经由神经网络模型提供。
1700541426
1700541427
神经网络模型同样需要使用平行语料库作为训练数据,但和统计机器翻译将模型拆解成多个部分不同,神经网络模型通常是一个整体的序列到序列模型。以常见的循环神经网络为例,神经网络模型首先需要将源语言和目标语言的词语转化为向量表达,随后用循环神经网络对翻译过程进行建模,如图14.33所示。通常会先使用一个循环神经网络作为编码器,将输入序列(源语言句子的词序列)编码成为一个向量表示,然后再使用一个循环神经网络作为解码器,从编码器得到的向量表示里解码得到输出序列(目标语言句子的词序列)。
1700541428
1700541429
1700541430
1700541431
1700541432
图14.33 循环神经网络
1700541433
1700541434
神经网络模型近年来已经成为机器翻译领域研究和应用的热点,对于神经网络翻译模型有很多新的改进,例如LSTM、注意力机制、训练目标改进、无平行语料训练等,机器翻译系统的性能正如日方升,一步步接近人类水平。
1700541435
1700541436
■ 机器翻译的应用
1700541437
1700541438
目前来说,机器翻译的效果还难以达到人类翻译的水平,但是随着机器翻译性能的提升,其应用场景也越来越多样化。谷歌2006年推出的谷歌翻译(Google Translate)已经走过十几个年头,目前已经支持上百种不同语言,提供了网页、手机客户端、程序API等多种访问方式。2017年5月的数据显示,谷歌翻译每天为5亿人次提供翻译服务。微软、百度、搜狗、网易等国内外公司也不断优化着自己的机器翻译服务,供大众使用。各种类型的机器翻译服务虽然暂时还无法直接用于书面翻译,但人们理解其他语言的壁垒已经大大降低,在很多场景下机器翻译都起到了很好的辅助作用。
1700541439
1700541440
出国旅游时,语言不通是很多人的一大痛点。各种手机App的拍图翻译使人们可以方便快捷地看懂异国他乡的路标或菜单等,如图14.34所示。百度、网易等公司将机器翻译成果用于旅游领域,推出专门的便携式翻译机(见图14.35),只要对着翻译机说出中文,就能自动帮用户翻译成其他语言,可谓是出国旅游神器。
1700541441
1700541442
1700541443
1700541444
1700541445
图14.34 谷歌翻译的拍图翻译
1700541446
1700541447
1700541448
1700541449
1700541450
图14.35 百度的便携翻译机
1700541451
1700541452
伴随着机器翻译性能的提升,各大公司的目标也逐渐放到了同传领域。在2016年的乌镇互联网大会上,搜狗CEO在演讲中使用了实时机器翻译技术,能够实时地将演讲语音转换成文字并同步翻译成英文,2018年的博鳌论坛引入了腾讯提供的机器翻译同传技术,然而实际效果并不尽如人意。可见,目前的机器翻译模型虽然已有很大的进步,但距离替代人类,在同传领域大展拳脚还有很长的一段路要走。
1700541453
1700541454
机器翻译领域吸引了越来越多的关注,同时也面临着巨大的挑战。如何克服现有的缺陷(例如神经网络模型可解释性差的问题),实现翻译性能的进一步提高仍是一个待解决的问题。现阶段机器翻译的应用仍处于简单理解其他语言、辅助翻译等方面,离大规模替代人工翻译还有不小的差距。但随着业界的广泛关注,人才的不断涌入,机器翻译领域将持续蓬勃发展,人类世界的巴别塔也终会得以重建。
1700541455
1700541456
1700541457
1700541458
1700541460
百面机器学习:算法工程师带你去面试 05 人机交互中的智能计算
1700541461
1700541462
1700541463
1700541464
人机交互(Human computer interaction),顾名思义,是研究人(用户)和计算机之间交互方式的学科,是人通过交互界面的一系列输入和计算机提供的输出反馈来完成一项任务或者达到一个目标的过程(见图14.36)。人机交互是一门交叉学科,与计算机科学、人机工程学、行为科学、认知学、心理学、媒体研究、设计等多门学科都有密切关联。
1700541465
1700541466
人机交互也可谓人工智能集大成的方向。在人机交互的过程中,语音识别、图像识别让机器能够理解人类的输入信号;各类预测模型、增强学习模型帮助机器做出有效且理性的判断,并使其具备学习的能力;智能控制类方法让机器完成人类指定的动作或者进行有效的反馈。可以说人机交互中蕴含着人工智能的方方面面,人机交互的高速发展意味着人工智能水平的整体进步。
1700541467
1700541468
1700541469
[
上一页 ]
[ :1.70054142e+09 ]
[
下一页 ]