加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长百科 > 正文

基于语音识此外IVR体系的计划与实现

发布时间:2017-08-07 12:17:08 所属栏目:站长百科 来源:佚名
导读:跟着春节的邻近,智妙手机僻静板电脑成为互赠礼品的最佳选择,尤其是今朝很是火爆的应用SIRI增加了购置指数。跟着智妙手机僻静板电脑的日益遍及,移动装备安详越来越被用户重视。那么谁能提供智妙手机僻静板电脑最安详的操纵体系呢?

  【IT168资讯】

  1 弁言

  IVR体系(Interactive Voice Response),即交互式语音应答体系,它被应用于呼唤中心(Call Center),以进步呼唤处事的质量、减轻处事员的事变强度并节减用度,是呼唤中心实现人机交互的重要派别,在传统的IVR体系中,用户与体系交互的方法是通过电话的键盘。凡是,用户在进入IVR体系后,会听到相干的语音提醒选单,按照本身的必要可以按下键盘上相干的按键。体系通过DTMF信号传送用户按下的键,同时也将用户的哀求传送给体系,从而触发相干的语音信息。然而,传统的电话仅能通过DTMF信号,传送有限的几个数字及标记按键。这使得用户与体系的交互界面受到很大的限定,同时也就使得IVR体系的信息查询范畴变得相等狭小,用户在现实行使时会感想诸多未便。

  跟着计较机技能和人工智能总体技能的成长,天然说话领略不绝取得盼望。语音辨认体系已成为一个越来越普及的应用偏向。因为电话收集的遍及性,天然说话处理赏罚体系在电话信道上的应用已成为最重要的应用之一。并且跟着移动通讯技能的成长和人们对付信息获取的移动性的需求不绝增进,市场对付电话语音辨认体系的需求也不绝的增进。因此在新一代呼唤中心的IVR体系中引入了语音辨认技能作为用户的输入本领,用户可以直接用语音与体系举办交互,这样大大进步了事变服从。

  2 辖档枉程及首要模块

  本体系方针是支持多用户并发查询车辆违章信息和驾驶证信息。用户行使天然的说话说出需查询信息的种别和车牌号码,体系辨认后将辨认功效反馈给用户,经用户确认后,体系把辨认功效作为靠山数据库查询的要害字举办查询,并将查询功效播放给用户。其流程见图1。本体系首要包罗以下几个模块:

  话路处理赏罚模块:以并发的方法节制和打点各电话话路。

  语音辨认模块:认真查询种别和车牌号码的辨认。

  靠山数据库查询模块:将语音识此外功效作为数据库查询的要害字举办查询。

  

基于语音识此外IVR体系的计划与实现

▲图1 车辆违章信息和驾驶证信息查询辖档枉程图

  3 话路处理赏罚模块的实现

  本体系的硬件部门是由电话语音卡和一台PC机构成,语音卡通过其提供的语音处理赏罚和信令处理赏罚手段,来实现用户的接入哀求和挂机信号的检测,并认真灌音和回放语音。本体系回收的是东进D161A语音卡。该语音卡可接入16条模仿电话线,提供16路以内的话路并行处理赏罚手段。其首要成果有:(1)自动增益节制及语音信号的压扩调动;(2)收罗和播放各类名目标电话语音信号,实现A律PCM、μ律PCM、ADPCM等算法;(3)辨识和发生DTMF信号;(4)ITU-TSS G3传真成果。

  话路处理赏罚的首要使命是电话振铃检测,播放体系提醒语音信息,接管用户的按键哀求和语音哀求,与靠山数据库模块通信,检索功效的语音合成和播放。整个模块有点相同于一个有限状态机,在措施计划时要跟踪体系所处的状态举办响应的举措,并进入下一个状态,其措施流程如图2所示。

  本体系话路处理赏罚模块的要害部门是语音数据的及时收罗。东进语音卡在这方面提供了一系列接口函数,如:StartRecordFile、StartRecordFileNew、VR_StartRecord等。这几个函数都可以或许实现对通道的灌音,所差异的是前两个函数将语音数据生涯到磁盘文件,后一个函数则将语音数据生涯到存储器缓冲区。因为我们要实现的是一个及时语音辨认体系,因此我们回收后者来收罗语音数据。在开始灌音之前,我们起首挪用VR_SetEcrMode函数启动反映克制成果,然后每隔一段时刻挪用一次VR_GetRecordData函数取得灌音数据,并将其送入语音辨认引擎。当语音辨认引擎有辨认功效返回时,遏制灌音,并按照辨认功效转入下一个状态。

  

基于语音识此外IVR体系的计划与实现
▲图2 话路处理赏罚流程

  4 语音辨认模块的实现

  语音辨认体系的开拓可以回收基于模板匹配的动态时刻规整(DTW)、基于统计参数模子的隐马尔可夫模子(HMM),神经收集等技能,他们都是针对某些详细应用的,其模子参数的得到必要对大局限的样本举办进修,对付非特定人语音辨认每每必要收罗数百人的语音样本,其事变量是相等大的。跟着语音研究的不绝成长,已经呈现了浩瀚的语音辨认开拓器材:如Microsoft Speech SDK,IBM ViaVoice等。他们都提供了语音辨认和语音合成的二次开拓平台,而且微软的Speech SDK是完全免费的,它具有辨认率高,辨认速率快,可移植性好,支持多种说话等利益。因此它被普及应用于各个规模。

  4.1 Microsoft Speech SDK 5.1简介

  SAPI SDK是微软公司免费提供的语音应用开拓器材包,这个SDK中包括了语音应用计划接口(SAPI)、微软的持续语音辨认引擎(MCSR)以及微软的语音合成(TTS)引擎等等。今朝的5.1版本一共可以支持3种说话的辨认 (英语,汉语和日语)以及2种说话的合成(英语和汉语)。SAPI中还包罗对付低层节制和高度顺应性的直接语音打点、实习领导、变乱、语法编译、资源、语音辨认(SR)打点以及TTS打点等强盛的计划接口。

  语音识此外成果首要由一系列COM接口和谐完成。个中首要的接口有下面这些:

  IspRecognizer接口:用于建设语音辨认引擎的实例,辨认引擎有两种:独有引擎(InProcRecognizer)和共享引擎(SharedRecognizer)。独有的引擎工具是在本措施的历程中建设,只能由本应用措施行使,而共享的引擎是在一个单独的历程中建设,可以供多个应用措施配合行使。

  IspRecoContext接口:首要用于接管和发送与语音辨认动静相干的变乱动静,装载和卸载辨认语法资源

  IspRecoGrammar接口:通过这个接口,应用措施可以载入并激活语礼貌则,而语礼貌则里界说了待识此外单词、短语和句子。凡是语礼貌则有两种:听写语法(DictationGrammer)和呼吁节制语法(CommandandControlGrammer)。听写语法用于持续语音辨认,可以辨认出引擎辞书中大量的词汇;呼吁节制语法用于辨认用户自界说的词汇。

  IspPhrase接口:通过这个接口,应用措施可以得到辨认信息,如:如辨认功效、识此外法则、语义标示和属性信息等。

  IspAudioPlug接口:通过这个接口,应用措施可以将内存中的语音数据送到语音辨认引擎,举办辨认。

  4.2 辨认模块的详细实现

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读