加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

Facebook的AI可说明心情包,但它能领略个中的内在吗?

发布时间:2018-09-16 20:11:33 所属栏目:运营 来源:网易科技报道
导读:网易科技讯9月15日动静,《连线》网站撰文指出,Facebook名为Rosetta的人工智能技能泛泛可说明数十亿张包括文本的图像,可以或许说明心情包,但它能像人类那样领略心情包的内在吗? 以下是文章首要内容: 天天都稀有十亿的文本帖子、照片和视频被上传到交际媒
副问题[/!--empirenews.page--]

Facebook的AI可说明心情包,但它能领略个中的内在吗?

网易科技讯9月15日动静,《连线》网站撰文指出,Facebook名为Rosetta的人工智能技能泛泛可说明数十亿张包括文本的图像,可以或许说明心情包,但它能像人类那样领略心情包的内在吗?

以下是文章首要内容:

天天都稀有十亿的文本帖子、照片和视频被上传到交际媒体上,这是人类考核员无法全面筛选的一个信息量级。因此,Facebook和YouTube等公司恒久以来一向依靠人工智能来辅佐办理垃圾邮件和色情内容等题目。

不外,对付呆板来说,考核像白人至上主义的心情包这样的对象也许更具挑衅性,由于这项使命必要同时处理赏罚几种差异的视觉元素。自动化体系必要检测和“读取”叠加在照片上的笔墨,并说明图像自己。心情包也是一种伟大的文化产品,很难离开语境去领略。尽量它们带来了挑衅,但一些交际平台已经在行使人工智能来说明心情包,个中包罗交际收集巨头Facebook。Facebook本周分享了它怎样行使一种名为Rosetta的器材来说明包括文本的照片和视频的细节。

Facebook暗示,它已经在行使Rosetta来自动检测违背其恼恨谈吐政策等划定的内容。该公司本周还公布,在该器材的辅佐下,它正在扩大其第三方究竟核查的全力,纳入照片和视频,而不只仅是基于文本的文章。Rosetta将自动搜查包括文本的图像和视频是否曾被标志为错误,从而辅佐完成检察。

Rosetta通过将光学字符辨认(OCR)技能与其他呆板进修技能相团结来处理赏罚照片和视频中的文本。起首,它行使OCR来辨认文本在心情包或视频中的位置。你也许早年用过相同OCR的对象;它可以让你快速赏识纸质表单,并将其转换为可编辑的文档。该自动化措施知道文本块的位置,并能将它们与你应该署名的处所区分隔来。

一旦Rosetta知道文本在那边,Facebook就会行使一个神经收集来转录文本并领略其寄义。然后,它可以将文本传输到其余的体系,好比一个搜查心情包是否与已经被戳穿的病毒圈套有关的体系。

Rosetta的研究职员暗示,该器材此刻可以及时从果真上传到Facebook的每张图片中提取文本,而且可以“阅读”多种说话的文本,包罗英语、西班牙语、德语和阿拉伯语。(Facebook暗示,Rosetta不会用于扫描用户在时刻轴上私密分享的图像或私信。)

Rosetta可以说明包括多种文本情势的图像,好比抗议标识、餐厅菜单、店面等的照片。在Facebook事变的软件工程师维斯瓦纳斯·西瓦库马尔(Viswanath Sivakumar)在一封电子邮件中说,这个器材既能辨认景观中的文本(好比街道标识),也能辨认心情包——但后者更具挑衅性。他写道,“在主动检测恼恨谈吐和其他违背政策内容的环境下,说明心情包式的图像是一项越发伟大的人工智能挑衅。”

西瓦库马尔指出,与人类差异,人工智能凡是必要看到成千上万个例子才气学会完成伟大的使命。可是,即即是对付Facebook而言,心情包方面的例子也不是无限无尽的,并且在差异的说话上网络足够多的例子也很坚苦。探求高质量的实习数据是人工智能研究的一个一连性挑衅。数据凡是必要耗费大量的工夫来举办手工标志,并且许大都据库都受到版权法的掩护。

为了实习Rosetta,Facebook的研究职员行使了在网站上果真宣布的含有某种文本情势的图片,以及它们的标注和宣布所在信息。他们还建设了一个措施来天生特另外示例,这种做法的灵感来自于牛津大学的一个研究团队在2016年计划的一种要领。这意味着整个进程在某种水平上是自动化的:一个措施自动地发生心情包,然后另一个措施试图说明它们。

差异的说话还给Facebook的人工智能团队带来了其余的挑衅。譬喻,研究职员必需找到一种变通要领来使得Rosetta可以或许用于阿拉伯语等说话。阿拉伯语从右到左阅读,与英语等其他说话相反。Rosetta倒着“阅读”阿拉伯语,颠末处理赏罚后,Facebook将那些字符颠倒过来。研究职员在他们的博客中写道:“这个能力的结果出奇的好,让我们有了一个同一的模子,它既合用于从左到右的说话,也合用于从右到左的说话。”

固然自动化体系在内容考核方面很是有效,但它们并不老是十拿九稳的。譬喻,腾讯的微信络行使两个差异的算法来过滤图像,多伦多大学国民尝试室的一个研究团队乐成地骗过了它们。第一个算法是基于OCR的措施,会过滤含有特定话题文本的照片,而另一个算法例会检察那些看起来与中国当局也许建设的黑名单相似的照片。

研究职员可以或许通过改变图像的属性,好比颜色或偏向,等闲地避开微信的过滤器。固然Facebook的Rosetta越发先辈,但也许也不是十全十美;该体系也许会受困于难以阅读的文本或扭曲的字体。全部的图像辨认算法也如故也许会受到反抗性的例子的影响,那些颠末稍微窜改的图像在人类看来是一样的,但会导致人工智能陷入紊乱。

在对特定种类的内容的考核方面,Facebook和Twitter、YouTube和Reddit等其他的平台在多个国度都面对着庞大的压力。周三,欧盟提出了一项新的礼貌,要求交际媒体公司在接到关照后一小时内删除可怕分子的帖子,不然将面对罚款。Rosetta和其他相同的自动化器材已经在辅佐Facebook和其他平台在德国等地遵守相同的法令。

它们在那方面也做得更好了:两年前,Facebook首席执行官马克·扎克伯格(Mark Zuckerberg)曾说,Facebook的人工智能体系只能主动捕获到该公司所删除内容的一半阁下;人们必需先要标志别的要删除的内容。此刻,Facebook暗示,它的人工智能器材可以检测到险些100%的垃圾邮件、99.5%的可怕内容和86%的暴力求片。YouTube等其他平台在操作自动内容检测体系上也取得了平等水平的乐成。

然而,这些喜人的数字并不料味着像Rosetta这样的人工智能体系是美满的办理方案,尤其是当涉及到更玄妙的表达情势的时辰。与餐馆菜单差异的是,假如不知道心情包的宣布配景,就很难领略它的寄义。这就是为什么有许多网站在致力于表明它们。心情包凡是描写的是圈内笑话,可能是针对特定的收集亚文化。人工智能如故不能像人类那样领略心情包或视频。就今朝而言,Facebook仍必要依赖人工考核员来抉择是否应该删除某个心情包。(乐邦)

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读