AI干起了实时翻译，我们离跨越语言的鸿沟还有多远？

发布时间：2017-09-20 22:03:37 所属栏目：编程来源：智能相对论

导读：企业怎么做品牌推广好推宝助力品牌提升知名度文 | 草原骑士来源 | 智能相对论 1954年，美国成功研制出了世界首个机器翻译系统，实现了俄英两种语言之间的简单转化。但由于人类语言本身的复杂性和多样性，半个多世纪以来，计算机系统对于人类语言的理解

副标题[/!--empirenews.page--]

　企业怎么做品牌推广好推宝助力品牌提升知名度

　　文 | 草原骑士

　　来源 | 智能相对论

　　1954年，美国成功研制出了世界首个机器翻译系统，实现了俄英两种语言之间的简单转化。但由于人类语言本身的复杂性和多样性，半个多世纪以来，计算机系统对于人类语言的理解一直处于相对较低的阶段，投入实际应用的研究成果寥寥无几。

　　直到近10年，以“深度学习”为代表的人工智能技术在语音识别、自然语言处理等基础应用领域与产业结合的业务中取得了较大突破，能够识别语音的机器翻译逐渐从实验室走向普罗大众。

　　在AI机器翻译这条赛道上，互联网巨头都在虎视眈眈

　　自去年乌镇互联网大会上，百度、搜狗相继亮相人工智能同声传译技术之后，又一次引发机器翻译是否会取代同声传译的激烈争论。

　　尽管专业人工翻译公司依然看衰AI对翻译产业的颠覆性，但包括Google、Facebook、微软、百度、腾讯、搜狗在内的各大技术巨头却在不遗余力地推进深度学习在机器翻译领域的研发和应用。

　　2016年9月，Google发布谷歌神经机器翻译(GNMT: Google Neural Machine Translation)系统，声称该系统利用神经网络技术，模仿人脑的神经思考模式，产出媲美人工翻译的高质量译文，并将误差降低了55%-85%。谷歌公司己经将该技术应用于网页翻译与手机应用，译文质量明显提升。

　　腾讯、百度、阿里巴巴等国内互联网公司将深度学习理念应用到机器翻译，在智能翻译领域持续发力，推出多款基于神经网络技术的在线翻译和手机应用。甚至在手机浏览器的升级战争中，智能翻译也被当作重要功能革新，搜狗手机浏览器推出“智能翻译”，集合了语音对话翻译、AR实时翻译、拍照翻译等常用功能。

　　智能翻译架起了不同语种间人们便利沟通的桥梁，已经成为日常交流、出国旅游、外文学习等方面不可或缺的助手。笔者就简要梳理一下AI实现文字和口语翻译的基本原理、结合实例介绍智能口语翻译难点以及智能翻译有哪些需要解决的问题。

　　各种花哨的技术概念，核心仍然是AI处理人类语言的三种方法

　　实现让计算机处理人类自然语言是人工智能领域的一个重要课题，与句法分析、语义理解和自然语言生成等计算语言学核心理论密切相关。目前，AI主要有三种方法翻译人类自然语言。

　　1、基于规则的机器翻译方法。早期机器翻译的主流方法。基于规则的机器翻译系统依靠人工编纂的双语词典和专家总结的各种形式的翻译转化规则，但在通用领域中的应用性不强，往往被限制在了专有应用上，逐渐被新的方法取代。

　　2、基于实例的机器翻译方法。从已有的翻译经验知识出发，将源语言句子切分为翻译知识中见过的短语片段，通过对已有翻译资源进行自动总结，得出双语对照的实例库，并设计规则处理双语对照实例库中的歧义性等问题，实现对新的源语言句子进行翻译。

　　3、基于统计的翻译方法。统计机器翻译方法将任何目标语言句子都看成源语言句子的可能翻译候选，从语料自动学习翻译模型，然后基于此翻译模型，对输入源语言句子寻找一个评价分数最高的目标语言句子作为翻译结果。目前谷歌、搜狗等基本采用的是这种。

　　深度学习能够自动学习抽象特征表示、建立源语言与目标语言之间复杂的映射关系，给统计机器翻译的实现提供新途径，目前已经在词对齐、语言模型训练、解码等模块的优化应用方面取得较多成果。例如，2006年谷歌发布基于短语的机器学习(PBMT)系统，该系统将句子分解成词和短句，进行逐个翻译。它的弱点在于忽略了上下文，因此译文质量不佳。2016年谷歌发布的神经机器翻译GNMT，将句子视为基本单元，不再对词和短句逐个翻译，明显改善了译文质量。

　　作为智能翻译的“制高点”，AI口语翻译难在哪?

　　与普通文字翻译相比，AI口语翻译难度更大，原因有二：

　　一、想要“译的准”，首先要能“听得清”。AI要准确判断出指令发出者的语音、停顿，并在极短时间内进行“语音断句”，在涉及一些模糊音时能够根据“上下文”进行及时调整，这需要有深度学习的模型自动更换为一个语义通顺、更符合作者指令的句子，然后才能进行文字翻译处理。

　　二、想要“译的准”，还要包容口语的“4个任性”

　　基于神经网络技术的智能翻译系统越来越多，翻译质量确有较大提高，但是能不能很好地包容口语的各种任性，我们来做几项测试，检验一下人工智能翻译的水平。为便于说明，选取了具有代表性的谷歌翻译和搜狗手机浏览器自带的智能翻译进行比对。

　　1、日常口语具有不连贯的特性。在口语交谈中，经常会出现一些不连贯的成分，如：重复、次序颠倒、冗余和语句残缺。下文是一个典型的兼有语句残缺和发音重复的句子。

　　原文：那六楼呢?咱们……咱们，下午谈一谈吧?

　　谷歌翻译：The sixth floor?Let's talk about us in the afternoon?

　　搜狗手机浏览器智能翻译：What about the sixth floor? Let’s… Let’s talk this afternoon.

　　谷歌翻译在重复的处理上未真实体现原文，搜狗手机浏览器智能翻译如实还原。但是，两个翻译结果在表达上都不同程度地存在错误。

　　2、语法约束相对较弱。口语中很少会有严格符合语法约束的结构完整、正确的句子，而大量存在的是语法规则难以处理的现象。一方面是由于系统的语法知识对语言现象的覆盖程度不足;而更主要的则是口语本身的特性所决定的，例如口语中存在大量的代词，人类口语比较容易理解，但是AI不能结合上下文，缺乏背景知识，难以区分指代对象，导致翻译结果偏离原意。

　　原文：Look, man, you don’t got to do anything. This one means a lot to me.

　　谷歌翻译：看，男人，你什么都不做。这对我来说意义重大。

　　搜狗手机浏览器智能翻译：听着，伙计，你什么都不用做，这对我意义重大。

　　翻译的关键在于两个词：look和man。谷歌的翻译也对，而看起来，搜狗手机浏览器的翻译结果更符合生活实际。

　　3、没有明确的句子边界。口语中没有标点符号来标志句子，也基本没有传统意义上的句子，缺少了必要的声调和停顿，很容易造成句子的歧义。

（编辑：河北网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

1/3

尾页

MYSQL_框架之主从GTID	MySQL Online DDL的实
MySQL 5.7 mysqldumps	MySQL TEXT、DATE、SE