加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

百度击败谷歌和微软,在AI语言领域夺冠

发布时间:2019-12-30 17:05:32 所属栏目:运营 来源:站长网
导读:百度最近开拓了一种新的AI领略说话模子,该模子在被公认的通用说话领略评估基准测试(Glue)中击败了谷歌和微软,得到了有史以来最高的分数。 Glue由九种差异的测试构成,这些测试包罗选择句子中的人物姓名,以及在存在多个隐藏选项时弄清晰“ it”等代词

百度最近开拓了一种新的AI领略说话模子,该模子在被公认的通用说话领略评估基准测试(Glue)中击败了谷歌和微软,得到了有史以来最高的分数。

Glue由九种差异的测试构成,这些测试包罗选择句子中的人物姓名,以及在存在多个隐藏选项时弄清晰“ it”等代词的寄义。在Glue量表上,人类的均匀得分约为87分,百度是第一个得分高出90分的公司。百度把这种AI说话模子称为ERNIE(Enhanced Representation from kNowledge IntEgration)。

百度击败谷歌和微软,在AI说话规模夺冠

研究职员一向在全力进步GLUE模子的机能,因此百度设定的当前尺度也许很快就会过期。可是,使百度取得明显成绩的是,他们行使的进修要领好像可以或许推广到其他说话。纵然该模子是为表明中文而开拓的,但沟通的道理仍使它更好的表明英语。ERNIE同样遵循BERT说话模子的成长。

BERT为双向模子设定了一种新的说话领略尺度。早年的说话模子仅可以或许表明在一个“偏向”上活动的数据,并将呈此刻方针单词之前或之后的单词视为上下文。BERT可以或许实现双向要领,该要领可以行使句子中的前一个词和后一个词来辅佐弄清方针词的寄义。BERT行使一种称为“遮蔽”的技能来举办双向说明,从而在句子中选择一个单词并将其潜匿,从而在前后上下文线索中拆分了该单词的也许上下文。

在英语中,单词是首要的语义单位,人们看整个单词而不是单个字符来分辨寄义。可以从上下文中删除一个单词,而且如故保持该单词的寄义,并且各个字符的寄义险些老是沟通的。相反,中文在辨认寄义时更多地依靠于字符怎样与其他字符匹配。字符也许取决于周围的字符而具有差异的寄义。

百度击败谷歌和微软,在AI说话规模夺冠

百度研究团队从本质上回收了BERT行使的模子并对其举办了扩展,潜匿了字符串而不是完备的单词。还对AI体系举办了实习,以区分随机字符串和故意义的字符串,以便可以袒护正确的字符串。这使ERNIE可以或许纯熟地从文本文档中检索信息并举办呆板翻译。研究团队还发明,他们的实习要领还造成了一个功效,该模子可以比很多其他模子更好地域分英语短语。这是由于英语偶然(尽量很少)行使的单词组合在毗连在一路时和单独行使时会表达差异的寄义。

ERNIE操作多种其他培训技能来优化机能,包罗在表明段落时说明句子次序和间隔。还行使一种持续的实习要领,该要领应承ERNIE实习新数据并进修新模式,而不会健忘早年得到的常识。

百度今朝行使ERNIE来进步搜刮功效的质量。ERNIE的最新架构将在即将在2020年人工智能促进协会集会会议上颁发的论文中具体先容。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读