VUI语音交互计划:三步打造使命导向型对话场景
计划使命导向型对话场景是一项关乎人类最天然的对话和AI最智能的技能团结的伟大而风趣的事变,但愿这篇文章对从事语音交互产物计划的同窗们有所辅佐。 5月10日,微软Build大会宣布智能音箱Invoke,6月6日,苹果WWDC宣布HomePod,7月5日,上午10点,百度AI开拓者大会宣布DureOS开放平台,统一天,下战书2点,阿里人工智能尝试室宣布天猫精灵……这个炎天,被人工智能烈日炙烤着的智能语音交互市场,热度可谓一起飙升。 语音交互的首要手段在于开放式domain的谈天型成果与使命导向的手艺型成果。假如说快捷高效、轻松天然是语音交互的奇异上风,那么使命导向型成果就是这些上风的美满落点,一个量好的语音交互产物,天然是技多不压身,可以或许cover的domain多越好,可以或许get的手艺越强盛越好。 那么,作为语音产物计划职员,怎样故短平快的方法计一律个使命导向型对话场景呢? 虽然,和传统交互计划事变一样,前期调研是很有须要的。你想计划的这个成果是否能满意产物方针、是否具备相干技能和数据手段支持以及切实用户现实需求?假若有两个场景摆在你计划的智能音箱眼前,一个是订外卖,而另一个是星座速配,你会选择优先做哪个? 一旦确定了要计划某个场景,接下来就可以着手计划事变了。详细来说就是三个步调:理清对话逻辑(Chat Flow)、计划语法(Grammer)以及计划应答 (Confirmation)。 第一步:对话逻辑——从那边来,到那边去?犹如图形用户界面以点击-触发为各个节点的交互逻辑,VUI也必要一从query到answer的流转逻辑,将一个场景的对话流程流通的贯串起来。 假设你计划的对话场景是查询氛围质量,请思量在这番对话中也许呈现的任何环境以及响应的反馈举措: 下图揭示了该场景也许的Chat Flow 即即是扣问气候这样看上去很简朴的对话场景,也可以计划出异常伟大的对话逻辑,按照该场景在你产物中的重要水平抉择细节逻辑的粒度。 第二步:计划语法 ——用户会对你说什么?语法就是用户输入的指令集,对话计划者必要计划对话的意图(Intent),以及只管思量用户也许表达方法,将个中最焦点、最常用的表达方法提取为指令集模板。计划的指令集越多越全面,对话包围率就会越高。 想象场景照旧查询氛围质量,请思量用户会用奈何的表达方法来提出本身的要求: “帮我查询氛围质量” “北京氛围质量指数” “本日PM2.5值是几多” “我必要戴口罩吗” “本日的氛围怎么样” …… 中华说话,博大博识,简朴的查询氛围质量,就有茫茫多的问法。不外不消着急,你只必要提取一些最典范的句式,至于“么”“吗”“呢”这些语气词,可能虚词、助词等,语义领略模块(NLU)会资助泛化。 下图为查询氛围质量对话指令集,个中 语音交互中最首要的应答方法是TTS(Text To Speech),就是将计划者写好的应答剧本,通过TTS引擎转化为语音播放出来。应答带给用户最直观的感觉,应答的优劣,直接相关到语音产物的体验。鉴于过长的语音内容会增进用户的影象负载,计划应答时应该只管简捷。同时,假如你的语音产物具备本身的本性特点,在应答时也请凭证该特点的说话气魄威风凛凛撰写剧本,保持脚色的同等性。 照旧查询氛围质量的例子,在第一步,计划对话逻辑的进程中,我们已经界说了该对话也许呈现的几类应答。别离是: 接下来,你只必要在对话剧本(script)文档里,施展你强盛的说话先天,举办完型填空就可以了。 “script”有“撰写影戏剧本”的寄义,而整个计划对话进程确实很像计划影戏剧本,有来言有去语,通干涉答的互动情势辅佐用户完成使命。 综上所述,计划使命导向型对话场景是一项关乎人类最天然的对话和AI最智能的技能团结的伟大而风趣的事变,但愿这篇文章对从事语音交互产物计划的同窗们有所辅佐。 作者:Rachel Hu,阿里云OS VUI交互计划师 文章作者系 @Rachel Hu 未经容许,榨取转载。 (编辑:河北网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |