摘要:
跳出传统质检,解读智能语音质检,从关键词检索到情感识别
在呼叫中心行业按照产品化思路来理解,每通人工电话就是我们的产品,针对这个产品的质检检控就是“质检”,它包括通话质量、服务质量、业务解决质量以及满意度等等。一般企业质检团队的配置比例为50:1~80:1。 做质检的目的是坐席员工进行工作质量评定,传统上都是通过抽检比例的形式来调查坐席工作质量。但是这样的传统质检不仅仅是在考验坐席员工、更是考验质检员工的工作态度。并且质检员工作非常繁重需要尽可能的覆盖更多的坐席员工,这样的传统质检使得质检员和坐席员工都很不适。
为什么企业需要质检?
想要了解质检的原因,就要先明白质检的目的。其实质检的目的很简单就是要提升客户满意度,提供企业收入。不难想象,客户拨打客服电话的动机:寻求解决问题的方法、反馈问题、发泄不满闲聊。座席席接通电话的目的:解决客户问题、解决不了帮助客户反馈问题,但是坚决抵制闲聊。 我们搭建质检团队,制定详细繁杂的质检指标和质检管理策略,但是仍然有一个主要问题没有解决——很多数据无法进行精细化分析。 通过量化指标,真正把座席人员当作强大的生产力去培养,允许部分的个人特色。后期允许用户选择坐席,而不是靠坐席等待客户的模式去推动生产服务。 传统质检,就是需要一堆人去抽样听录音质量。录音的作用就是被抽样出来做质检使用,或者留存以后备投诉核查。这么多年录音的作用就是被这样使用掉的,业务不要,客服中心不爱。 但是现在技术的发展可以使得我们把全量录音数据转化为富文本数据、转化为个人情绪判定的结构化数据。之前我们建立的客户画像都是数字化的画像,但结合录音,我们可以把客户画像变成一个“带感情的人”。 我们质检的动作提前,利用现有技术手段,比如坐席助手、语音助手、情绪监测、可视化质检等手段可以尽早提醒坐席人员注意调整和休息,改善服务质量,提升工作效果。 随着近十年人工智能技术的发展,语音和自然语音处理技术不断取得突破,采用智能化的方法对电话语音中的内容进行深层次的分析,可以有效的节约人力成本并提高工作效率。就现在技术而言,语音质检方案主要涉及语音关键词检索、音频对比、情感识别等核心技术。一、关键词检索功能
基于语音识别技术,关键词检索是将语音识别的结果构建成一个索引数据库,然后把关键词从索引数据库中找出来。首先将语音数据进行识别处理,从里面提取索引构建索引数据库,在进行关键词检索的时候,找到概率最高的,输入其关键词匹配结果。 确定关键词检索网络后,接下来进行的是关键词检索。关键词检索可以基于音节信息。首先将用户设定的关键词文本解析成音节序列,再从检索网络中找出匹配结果,相比直接对文本结果进行检索,这种方法的容错性更强,因此,计算量更小,执行效率更高,更适用于语音质检这种海量数据检索的应用场景。 音频比对是指从音频信号提取特征,通过特征进行比对的方法进行有害信息检索的方法。该方法的核心在于提取的特征值需要满足一定的要求,比如抗噪性、转换不变性、鲁棒性、快速性等特点,主要是为了满足同一音频能够在不同声道下进行准确检索。 传统的声学特征已经不能满足音频比对任务的需求。所以在完成最大值点完成建模后,需要进行特征的构建,而特征构建是通过最大值点之间的距离来建模,例如两个最大值点的距离、位置信息作为一个固定的特征来完成音频特征信息的构建。 有了上述音频特征之后,就可以对两个不同音频进行检索,最大相似度的地方就是相似点,这种技术最适用于文本内容无关的录音片段的检索。三、情感识别
语音是人类交际的最重要的工具之一。人们在进行自然口语对话时,不仅传递声音,更重要的是传递说话人的情感状态、态度、意图等。根据情感模型的不同,情感语音识别主要分为离散情感识别和连续情感语音识别。 离散情感识别是一个典型的模式分类问题,各种传统的分类器均被广泛应用于语音情感识别系统,例如隐马尔科夫模型、高斯混合模型、支持向量机,人工神经网络等。维度情感识别一般被建模为回归预测问题。