李笛回忆 , 最开始时 , 团队想要做的是一个人工智能助理:“对助理来讲 , 有用是他最重要的特点 , 我们那时候是这么认为的 。”
而在对一些优秀的人类助理进行访谈后 , 李笛发现 , 对于助理来讲 , 最重要的事是和老板调整成一种合适的同事关系 , 这种同事关系必须让老板认为助理有自己的想法 , 会在一些合理的时机去拒绝 。这样的关系带来的好处是 , 为自己的工作带来更多的空间与余地 , 同时让老板意识到助理不是命令处理器 , 而拥有做更多事情的能力 。“这种关系是基于care(关心) , 他让老板认为助理所有谨慎的判断是因为他care(关心)这个老板 , 所以他跟老板之间能够产生共情与信任 。”
带着这样的结论 , 小冰系统诞生了 。李笛认为 , 小冰关心的是整个对话全程 , 关心用户在对话之后与人工智能之间建立了怎样的关联 。“如果有人认为小冰还挺逗的、不是特别以知识为主 , 但是很有意思 , 我没事愿意跟它交流 , 有事问它 , 如果回答了而且很好 , 我会很惊喜 , 这个对系统来讲是一个很有利的状态 。”
但李笛同时也坦言 , 产生似是而非的错误信息或者直接把对话向其他地方去迁移的情况 , 在小冰身上也很多 。为此 , 小冰本身会给对话系统留下足够高的弹性 。李笛举例 , 当人工智能系统面对用户的一些黄赌毒、色情等类型的问题时 , 系统要保护自己 , 而绝大部分的大模型 , 包括ChatGPT , 它们注意到人类可能有一些不怀好意的问题时的回答直截了当:“我不想回答这个问题 。”而这个回答 , 在小冰的评分体系里 , 会得到很低的得分 。
在小冰的应对策略中 , 不会直接向用户表明不想回答问题 , 而是会选择抛出一个新的对话 , 如果用户成功与之展开新对话 , 则无形之中也化解了风险 。小冰也会观察用户是否进入新的对话 , 如果没有 , 系统会开始尝试降低回答的相关性 。“我们宁愿让用户觉得你笨 , 放弃了攻击你或者是让你上钩 , 也不愿意让用户觉得你很聪明地挡住了他 , 而激发了用户挑战的信心 , 换一个更难的方法来问你 。”
在李笛看来 , 这是人工智能聊天机器人需要的取舍 , 因为人类与机器的交互绝不是单纯考虑回答问题的相关度、任务的完成率 , 同时还有考虑下一轮对话可能的走向 。
小冰的取舍与判断依据来自其大数据与高交互量 。“小冰一天的交互量相当于14个人一辈子的交互量 , 它遇到的事情特别多 , 所以有很多机会去尝试各种过程、策略是不是正确有效的 。”但李笛同时也指出 , 对人工智能聊天机器人而言 , 单纯的交互量无法提高训练质量 , 大的训练数据、实时在线训练数据的获得是一个很重要的壁垒 , 但它与高交互量还有本质的区别 。
如果大量的交互都是围绕“开灯”“关灯”这类简单指令 , 实际上没有训练价值 。更为重要的应当是CPS(conversations per session) , 即AI与人一次对话的轮数 。李笛介绍 , 小冰目前的CPS轮次已经达到38轮 。
除此之外 , 实际产品落地带来的经验 , 人工智能安防的能力 , 对话内容与声音、视觉的配合所组成的完备框架 , 也共同构成着小冰的壁垒 。“我们有的时候会把单点技术和形成一个系统混淆起来 , 过于夸大一个单点技术所对应的价值 , 这就有点像当我们去讨论一辆汽车或者汽车工业时 , 会认为发动机是关键 , 发动机确实是关键技术之一 , 但是很有可能最后是车身成为限制汽车工业能不能跑起来的最后的、真正的短板 。”
如何看待通用人工智能
在这一轮ChatGPT的狂欢浪潮中 , 有观点认为 , 其代表的是未来实现通用人工智能的一个可行路径 , 即AI有可能由处理专一领域的问题向同时处理多领域问题转变 。
李笛则依旧对此持相对冷静的态度 。“它的优化不是为了优化到给你合适的知识 , 而是为了优化到让你认为它有知识 , 它的对话中 , (与其他聊天机器人相比)它增加的部分大量是在论证 , 由此让你感觉到它很可靠 。”
推荐阅读
- 代代花的功效与作用及禁忌症有哪些__代代花的功效与作用?
- 玲珑瓜被誉为?金美人蜜瓜的功效与作用?
- 柿子与酸奶一起吃有没有问题
- 柿子与茶能一起吃吗
- 板粟南瓜的功效与作用
- 氯气与水反应可逆吗 氯气与水反应
- 鲁滨逊漂流记主要内容50字?《鲁滨逊漂流记》的主要内容是什么?
- 南澳大桥24小时通车吗
- 羊汤和螃蟹可以一起吃吗
- 莫桑钻和钻石的区别