AI人工智能|智能语音机器人底层系统设计逻辑( 三 )


应从系统的实际业务需求去考虑并发数 , 保证FS的性能稳定 。
3. ASR识别准确率
虽然目前很多供应商标明的语音识别率都达到了97%甚至98% , 但此指标对环境的要求较高 。
而实际环境在噪音较大 , 口音 , 语言混合等场景下 , ASR识别准确率均有一定程度的下降 。
4. 语义理解
在对话机器人中语言理解(NLU)模块主要包括意图识别和槽位识别 , 这两点直接影响语义理解的效果 。
语音场景下 , 经常出现用户回复单语气词的情况 , 如“嗯” , “啊”等 , 或语音特有意图 , 如“大点声” , “说快点” , 要求“重说”等 , 在意图设计时需考虑到此类特殊场 , 以及其应答策略 。
前面提到的ASR识别错误会导致语义理解部分受影响 , 目前可采用加入多模态学习的优化方案 , 同时融合音频特征 , 纠正语音识别结果 , 此方案经验证对意图识别模块准确率会有近2%的提升 。
5. 对话管理模块设计合理性
机器人对话管理模块设计的合理性 , 直接决定了整个呼叫任务流程的体验感和完成率 。
对话管理模块的重点在于对话状态追踪(DST)和对话策略设计(DPL)的合理性 , 如:打断、无声等语音特有场景 , 如何在提升用户体验的同时确保外呼任务流的正常正常进行 。
6. 话术设计的合理性
话术设计也是语音任务机器人设计中非常重要的一个部分 , 为提升用户的体验 。
话术设计可遵循以下几个原则:话术设计更贴合应用场景;主干话术设计精简有吸引力;话术拟人化;不同状态下话术变化 。
六、结语
目前 , 随着AI技术的不断进步 , 市场需求的进一步扩大 , 智能语音机器人在实际应用场景中的表现也越来越好 , 逐渐能胜任更多的业务工作 。
不过其难点仍然存在 , 期待未来在更多AI技术的赋能下 , 智能客服机器人能力有更大程度的提升 , 能让我们在生活中体验到更贴心智能的机器人服务 。
以上内容基于笔者结合学习和工作实践的思考 , 若有理解不到位之处 , 还望大家指正 , 更希望通过这篇文章能与各位多多交流 。
参考资料:IDC《中国人工智能市场软件及应用半年度研究报告(2019H2)》艾瑞网《2019年中国人工智能产业研究报告》58同城《智能语音机器人助力企业提效增收》
本文由 @岑为 原创发布于人人都是产品经理 , 未经许可 , 禁止转载
【AI人工智能|智能语音机器人底层系统设计逻辑】题图来自 Unsplash , 基于 CC0 协议


推荐阅读