人工智能的核心技术是啥( 二 )
(3)此外,机器学习的常见算法还包括迁移学习、主动学习和演化学习等。
迁移学习 迁移学习是指当在某些领域无法取得足够多的数据进行模型训练时,利用另 一领域数据获得的关系进行的学习。迁移学习可以把已训练好的模型参数迁移到 新的模型指导新模型训练,可以更有效的学习底层规则、减少数据量。目前的迁 移学习技术主要在变量有限的小规模应用中使用,如基于传感器网络的定位,文 字分类和图像分类等。未来迁移学习将被广泛应用于解决更有挑战性的问题,如 视频分类、社交网络分析、逻辑推理等。
主动学习 主动学习通过一定的算法查询最有用的未标记样本,并交由专家进行标记, 然后用查询到的样本训练分类模型来提高模型的精度。主动学习能够选择性地获 取知识,通过较少的训练样本获得高性能的模型,最常用的策略是通过不确定性 准则和差异性准则选取有效的样本。
演化学习 演化学习对优化问题性质要求极少,只需能够评估解的好坏即可,适用于求 解复杂的优化问题,也能直接用于多目标优化。演化算法包括粒子群优化算法、 多目标演化算法等。目前针对演化学习的研究主要集中在演化数据聚类、对演化 数据更有效的分类,以及提供某种自适应机制以确定演化机制的影响等。
2 知识图谱
知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结 构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体 —关系—实体”三元组,以及实体及其相关“属性—值”对。不同实体之间通过 关系相互联结,构成网状的知识结构。在知识图谱中,每个节点表示现实世界的 “实体”,每条边为实体与实体之间的“关系”。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,提供了从“关系”的角度 去分析问题的能力。
知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域,需 要用到异常分析、静态分析、动态分析等数据挖掘方法。特别地,知识图谱在搜 索引擎、可视化展示和精准营销方面有很大的优势,已成为业界的热门工具。但 是,知识图谱的发展还有很大的挑战,如数据的噪声问题,即数据本身有错误或 者数据存在冗余。随着知识图谱应用的不断深入,还有一系列关键技术需要突破。
3 自然语言处理
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,研究能 实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及的领域较 多,主要包括机器翻译、机器阅读理解和问答系统等。
(1)机器翻译
机器翻译技术是指利用计算机技术实现从一种自然语言到另外一种自然语 言的翻译过程。基于统计的机器翻译方法突破了之前基于规则和实例翻译方法的 局限性,翻译性能取得巨大提升。基于深度神经网络的机器翻译在日常口语等一 些场景的成功应用已经显现出了巨大的潜力。随着上下文的语境表征和知识逻辑 推理能力的发展,自然语言知识图谱不断扩充,机器翻译将会在多轮对话翻译及 篇章翻译等领域取得更大进展。
目前非限定领域机器翻译中性能较佳的一种是统计机器翻译,包括训练及解 码两个阶段。训练阶段的目标是获得模型参数,解码阶段的目标是利用所估计的 参数和给定的优化目标,获取待翻译语句的最佳翻译结果。统计机器翻译主要包 括语料预处理、词对齐、短语抽取、短语概率计算、最大熵调序等步骤。基于神 经网络的端到端翻译方法不需要针对双语句子专门设计特征模型,而是直接把源 语言句子的词串送入神经网络模型,经过神经网络的运算,得到目标语言句子的 翻译结果。在基于端到端的机器翻译系统中,通常采用递归神经网络或卷积神经 网络对句子进行表征建模,从海量训练数据中抽取语义信息,与基于短语的统计 翻译相比,其翻译结果更加流畅自然,在实际应用中取得了较好的效果。
推荐阅读
- 山西太原把ETC收费技术引入高铁站停车交费快至0.27秒
- 长沙航院向部队输送逾六千名专业技术士官居全国高职院校之首
- [技术创新]苏州创建国家级充换电技术创新中心 助力新能源行业发展
- 黄金时间■新技术加持!江苏高标准农田灌溉效率大幅提升
- 用生物技术排地雷东北林业大学学子斩获国际金奖
- 疫苗|值得你摘下“有色眼镜”【转基因的另一面】转基因技术
- 特斯拉|热评 | 加强OTA技术召回监管将有助于汽车产业健康发展
- 一同选车|全球销冠!比亚迪的插电混动技术究竟有多强?
- 西安两男子从网上学会这种技术,竟专门用来......刑拘!
- |第七届淮海科学技术奖获奖名单揭晓121个创新项目、10名科技人才获奖
