加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

澎思科技声纹识别技术刷新RSR2015数据集新记录

发布时间:2020-01-10 12:49:05 所属栏目:运营 来源:新京报|0
导读:克日,澎思科技与新加坡国立大学Human LanguageTechnology (HLT) 尝试室配合研究的声纹辨认 (Speaker Verification) 技能在RSR2015数据集上革新天下记载。对比今朝主流的算法,该技能可以在行使50%或更少的数据举办呆板进修的环境下,依然在各类较量协议中

  克日,澎思科技与新加坡国立大学Human LanguageTechnology (HLT) 尝试室配合研究的声纹辨认 (Speaker Verification) 技能在RSR2015数据集上革新天下记载。对比今朝主流的算法,该技能可以在行使50%或更少的数据举办呆板进修的环境下,依然在各类较量协议中示意出异常优秀的机能。此番打破,揭示了以计较机视觉技能见长的澎思科技,在技能储蓄的深度和宽度上的双向拓展。

  bd315c6034a85edf258565170ad30d25dd547502.jpeg

  “听见识人”的黑科技

  声纹辨认(Speaker Verification)也称为措辞人辨认,是一种通过声音鉴别措辞人身份的技能。该技能通过对一种或多种语音信号的特性说明来到达对未知声音辨此外目标,简朴的说就是分辨某一句话是否是某一小我私人说的技能。

  声纹辨认作为生物辨认技能的一种,在民众安详、金融、智能家居和办公等规模都有很是辽阔的应用场景,譬如侦查破案、反电信诈骗、治安防控、身份认证、付出、门禁、集会会议灌音等。对比于人脸辨认和指纹辨认,声纹的收罗只必要麦克风模块,本钱对比于摄像头可能指纹辨认模块而言要低,收罗的利便性和安详性则要高。在一些非凡规模,声纹辨认更是具有唯一无二的上风。

  在现实应用中,声纹辨认体系每每必要用户事先录入声音,以是操作更少的数据完成声纹识此外实习在现实应用中有着很大的需求。澎思科技提出的新算法,极大低落了逊??需的数据量,但仍旧可以实现很是高的辨认精度,有着很是重要的现实应用代价。

  革新RSR2015数据集新记录

  RSR2015 (Robust SpeakerRecognition 2015) 数据库是由新加坡国度科技研究局(Agency for Science, Technology andResearch, A*STAR) 信息通讯研究所(Institutefor Infocomm Research, IR) 网络和宣布的,被普及应用于声纹辨认等规模的研究事变,是今朝最主流的大型语音数据库之一。该数据库旨在为声纹辨认规模提供相干的数据资源,应承行使差异范例的较量协议。

  声纹辨认中最常用的评价指标是等错误率(Equal Error Rate,EER),在调解阈值后,使得错误拒绝率(FalseRejection Rate,FRR)便是错误接管率(False Acceptance Rate,FAR),此时的FAR与FRR的值称为等错误率。一样平常来说,越低的等错误率暗示体系有越好的辨认精确性。

 8cb1cb13495409238c795cc9d0dfd50fb2de4985.jpeg

cdbf6c81800a19d8197004c37d7d868da71e4616.png

  表格1中别离是数据库第一部门的4个子集的测试功效。个中TW (target wrong) 指的是正确的声纹验证工具可是行使了错误的口令;IC (imposter correct) 代表行使正确口令的声纹信息的冒名顶替者; IW (imposter wrong) 代表行使错误口令的拥有错误声纹信息的人。

  在这三项指标中,较为重要的是IC使命。澎思科技提出的新技能在晋升该项使命的精确度的同时,分身思量了整个体系的总体机能。

3c6d55fbb2fb43162ab9d2886f23422508f7d32f.png

  SV (Speaker Verification)和 UV (UtteranceVerification)别离是针对声纹与口令识此外机能评估方法。两项使命综合浮现基于文本的声纹体系在两个使命上的机能示意。个中,SV使命的机能尤为重要。

  在全部的比拟中,绝大大都的算法都行使了RSR2015的配景集(background set)和成长集(development set)的数据以到达更好的结果。乃至在一些算法中,会添加更多其他数据集的数据来晋升精确性。与之差异的是,澎思科技提出的新技能并不依靠于这些的数据,在少少的实习数据环境下,仍旧有着很是高的精确性。具体的技能细节将在澎思科技与新加坡国立大学HLT尝试室连系提交至Interspeech2020的论文中先容,敬请等候。

  打破前沿技能 严守智能安防重地

  声纹辨认技能在民众安详规模有重要的应用远景和庞大的市场需求,一向是安防行业研究的重点。

  澎思科技作为一家专注于计较机视觉和物联网技能,提供“以工钱焦点”行业综合应用办理方案的人工智能公司,此次在声纹辨认规模取得的打破,彰显了公司技能储蓄的深度和宽度。声纹辨认技能一方面切合公司在智能安防御围深耕的久远愿景,是针对用户需求深挖场景,发明行业痛点打磨出的新算法技能和产物;另一方面,也富厚公司计较机视觉之外的技能池,晋升了技能方案的完备性,为行业和落地场景的拓展做好筹备。

  在将来,澎思科技的声纹辨认等语音技能将慢慢应用到安全都市、伶俐社区、伶俐园区、伶俐零售、伶俐交通等拭魅战应用场景中,在与计较机视觉和物联网技能的共同下,提供更多有用靠得住的产物和方案,敦促AI技能的产物化落地和贸易化历程。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读