人工智能的核心技术是啥( 三 )



(2)语义理解
语义理解技术是指利用计算机技术实现对文本篇章的理解,并且回答与篇章 相关问题的过程。语义理解更注重于对上下文的理解以及对答案精准程度的把控。 随着 MCTest 数据集的发布,语义理解受到更多关注,取得了快速发展,相关数 据集和对应的神经网络模型层出不穷。语义理解技术将在智能客服、产品自动问 答等相关领域发挥重要作用,进一步提高问答与对话系统的精度。

在数据采集方面,语义理解通过自动构造数据方法和自动构造填空型问题的 方法来有效扩充数据资源。为了解决填充型问题,一些基于深度学习的方法相继 提出,如基于注意力的神经网络方法。当前主流的模型是利用神经网络技术对篇 章、问题建模,对答案的开始和终止位置进行预测,抽取出篇章片段。对于进一 步泛化的答案,处理难度进一步提升,目前的语义理解技术仍有较大的提升空间。

(3)问答系统
问答系统分为开放领域的对话系统和特定领域的问答系统。问答系统技术是 指让计算机像人类一样用自然语言与人交流的技术。人们可以向问答系统提交用 自然语言表达的问题,系统会返回关联性较高的答案。尽管问答系统目前已经有 了不少应用产品出现,但大多是在实际信息服务系统和智能手机助手等领域中的 应用,在问答系统鲁棒性方面仍然存在着问题和挑战。

自然语言处理面临四大挑战:一是在词法、句法、语义、语用和语音等不同 层面存在不确定性;二是新的词汇、术语、语义和语法导致未知语言现象的不可 预测性;三是数据资源的不充分使其难以覆盖复杂的语言现象;四是语义知识的 模糊性和错综复杂的关联性难以用简单的数学模型描述,语义计算需要参数庞大 的非线性计算。

4 人机交互
人机交互主要研究人和计算机之间的信息交换,主要包括人到计算机和计算 机到人的两部分信息交换,是人工智能领域的重要的外围技术。人机交互是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科。传统的人与计算机之间的信息交换主要依靠交互设备进行,主要包括键盘、鼠标、 操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备,以及打印机、绘图仪、显示器、头盔式显示器、音箱等输出设备。人机交互技术 除了传统的基本交互和图形交互外,还包括语音交互、情感交互、体感交互及脑 机交互等技术,以下对后四种与人工智能关联密切的典型交互手段进行介绍。

(1)语音交互
语音交互是一种高效的交互方式,是人以自然语音或机器合成语音同计算机 进行交互的综合性技术,结合了语言学、心理学、工程和计算机技术等领域的知 识。语音交互不仅要对语音识别和语音合成进行研究,还要对人在语音通道下的 交互机理、行为方式等进行研究。语音交互过程包括四部分:语音采集、语音识 别、语义理解和语音合成。语音采集完成音频的录入、采样及编码;语音识别完 成语音信息到机器可识别的文本信息的转化;语义理解根据语音识别转换后的文 本字符或命令完成相应的操作;语音合成完成文本信息到声音信息的转换。作为 人类沟通和获取信息最自然便捷的手段,语音交互比其他交互方式具备更多优势, 能为人机交互带来根本性变革,是大数据和认知计算时代未来发展的制高点,具 有广阔的发展前景和应用前景。

(2)情感交互
情感是一种高层次的信息传递,而情感交互是一种交互状态,它在表达功能 和信息时传递情感,勾起人们的记忆或内心的情愫。传统的人机交互无法理解和 适应人的情绪或心境,缺乏情感理解和表达能力,计算机难以具有类似人一样的 智能,也难以通过人机交互做到真正的和谐与自然。情感交互就是要赋予计算机 类似于人一样的观察、理解和生成各种情感的能力,最终使计算机像人一样能进 行自然、亲切和生动的交互。情感交互已经成为人工智能领域中的热点方向,旨 在让人机交互变得更加自然。目前,在情感交互信息的处理方式、情感描述方式、 情感数据获取和处理过程、情感表达方式等方面还有诸多技术挑战。


推荐阅读