及时行乐|语音机器人是如何帮助金融机构获取AI“超能力”的?( 二 )


二、新一代的机器人的超能力——决策森林
机器人有四项基本能力:模拟人的听、说、理解和决策的能力 , 过去更多是在听和说方面 。
一是听 。 用户说一句话 , 我要通过语音识别 , 把它转化成文字 。 就像用手机输入法一样或者微信说一段话 , 会把文字转化成文本 , 这就相当于模拟人脑听的能力;
二是说 。 把这段话用语音合成的方式 , 合成一段声音放给用户听 。
三是决策 。 过去是让人配一个简单的逻辑图 , 现在更多要通过机器深度学习 , 去学习过去客服和人、用户对话的各种语料里面 , 人是怎么完成对话的套路以及决策 。 从深度学习到深度理解 , 未来机器要通过深度理解去学习人怎么在对话过程中 , 判断用户的意图 , 再根据用户的意图做接下来的决策 , 怎么去表达 。
这是新一代的方案 。
我们会把一个一线客服过去两年和用户对话上万通的录音拿出来 , 从这些录音里边通过深度学习 , 去学习它的声音 , 包括在和用户对话过程中言语上的习惯、口头词 , 包括在什么地方容易停顿 , 以及激动、生气、平缓的时候怎么说 。 学习各种各样的情绪 , 最重要的是它的决策 。
在正常的过程中 , 每一个客服都有一个公共、通用的标准要求 , 客服进线怎么跟客户聊 。 实际上 , 在这个工作流程的基础上 , 每个客服都会结合自己的一些兴趣、爱好、特长自由发挥 。 同样一段话 , 用户表达同样一个问题的时候 , 客服可能用不同的话去回答用户 , 每个人都会有他自己的决策逻辑 。
假如这是一个电销的场景 , 我们会从业务的最终结果出发——去选 , 哪个客服在过去几个月内业绩最高 , 投诉最低 。 选出来之后 , 用它历史上作业的所有录音 , 刻录出来这么一个人 。 再用这个人的声音、话术、决策逻辑和用户对话 , 用户完全无感知 。
现在市场主流机器人 , 一段声音要先转化成文本 , 通过语音识别和自然语言的理解 , 猜出用户的意图 。 决策怎么做?人工会在这个位置给他配一个决策逻辑 , 比如开场白怎么说 。 用户问了A , 你怎么回答B 。 用户问了B , 你怎么回答C , 是人工按照经验画了一个图 。 机器人在对话过程中 , 完全按照这个图的逻辑往下走 , 它不会改 。 甭管是谁 , 怎么问 , 它都会按照这个逻辑跳 。 如果用户说了一句不在决策图里的问题 , 它就不知道怎么回答 。
新一代的机器人深度学习的底层基础没有发生太大变化 , 更多的改变是决策方面 。 过去是单独的一棵决策树 , 现在更多是决策森林 。
及时行乐|语音机器人是如何帮助金融机构获取AI“超能力”的?我们会根据过去所有对话、各个地图节点里边 , 哪一条路径是机器学习的最佳路径 , 然后在最佳路径上面强化学习 。 假如这条对话路径过去成单率、回收率、客户满意度最高 , 那这一条决策路径权重会更高 , 相当于机器永远去学习人工在整个业务场景里面最佳的对话决策逻辑 。 这样的话 , 就会朝着金牌客服能力去靠近 。
刚才讲了机器人实现的原理 , 包括新一代机器人的方向 。 现在机器人更多用在金融的场景里面 , 包括银行这种金融机构 , 可能会做获客、电销、信审、客服、贷后的催收 。
三、机器人的另一个超能力——用户画像
一个机器人客服和用户聊天 , 当他聊完一分钟或者两分钟结束之后 , 能够根据整个对话 , 给用户做一个画像 。 这个能力是实时的 , 而且是非常客观的 。 如果人工客服和用户做聊天 , 聊几分钟之后 , 挂完电话 , 让人工给用户打标签 , 这是一个非常主观的过程 , 每个人的理解不一样 。
【及时行乐|语音机器人是如何帮助金融机构获取AI“超能力”的?】但如果是机器人的话 , 就会严格按照对话的逻辑去给用户画像 。 用户承诺还款或者拒绝还款;客户对于额度、利率感兴趣 , 或对产品有疑问;不会漏掉任何一个信息 , 每个信息都会非常客观地记录下来 , 并且给用户实时地打一个标签 。


推荐阅读