人工智能的核心技术是啥( 四 )
(3)体感交互
体感交互是个体不需要借助任何复杂的控制系统,以体感技术为基础,直接 通过肢体动作与周边数字设备装置和环境进行自然的交互。依照体感方式与原理 的不同,体感技术主要分为三类:惯性感测、光学感测以及光学联合感测。体感 交互通常由运动追踪、手势识别、运动捕捉、面部表情识别等一系列技术支撑。与其他交互手段相比,体感交互技术无论是硬件还是软件方面都有了较大的提升, 交互设备向小型化、便携化、使用方便化等方面发展,大大降低了对用户的约束, 使得交互过程更加自然。目前,体感交互在游戏娱乐、医疗辅助与康复、全自动 三维建模、辅助购物、眼动仪等领域有了较为广泛的应用。
【人工智能的核心技术是啥】 (4)脑机交互
脑机交互又称为脑机接口,指不依赖于外围神经和肌肉等神经通道,直接实 现大脑与外界信息传递的通路。脑机接口系统检测中枢神经系统活动,并将其转 化为人工输出指令,能够替代、修复、增强、补充或者改善中枢神经系统的正常 输出,从而改变中枢神经系统与内外环境之间的交互作用。脑机交互通过对神经 信号解码,实现脑信号到机器指令的转化,一般包括信号采集、特征提取和命令 输出三个模块。从脑电信号采集的角度,一般将脑机接口分为侵入式和非侵入式 两大类。除此之外,脑机接口还有其他常见的分类方式:按照信号传输方向可以 分为脑到机、机到脑和脑机双向接口;按照信号生成的类型,可分为自发式脑机 接口和诱发式脑机接口;按照信号源的不同还可分为基于脑电的脑机接口、基于 功能性核磁共振的脑机接口以及基于近红外光谱分析的脑机接口。
5 计算机视觉
计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类 提取、处理、理解和分析图像以及图像序列的能力。自动驾驶、机器人、智能医 疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。近来随着深 度学习的发展,预处理、特征提取与算法处理渐渐融合,形成端到端的人工智能 算法技术。根据解决的问题,计算机视觉可分为计算成像学、图像理解、三维视 觉、动态视觉和视频编解码五大类。
(1)计算成像学
计算成像学是探索人眼结构、相机成像原理以及其延伸应用的科学。在相机 成像原理方面,计算成像学不断促进现有可见光相机的完善,使得现代相机更加 轻便,可以适用于不同场景。同时计算成像学也推动着新型相机的产生,使相机 超出可见光的限制。在相机应用科学方面,计算成像学可以提升相机的能力,从 而通过后续的算法处理使得在受限条件下拍摄的图像更加完善,例如图像去噪、去模糊、暗光增强、去雾霾等,以及实现新的功能,例如全景图、软件虚化、超 分辨率等。
(2)图像理解
图像理解是通过用计算机系统解释图像,实现类似人类视觉系统理解外部世 界的一门科学。通常根据理解信息的抽象程度可分为三个层次:浅层理解,包括 图像边缘、图像特征点、纹理元素等;中层理解,包括物体边界、区域与平面等; 高层理解,根据需要抽取的高层语义信息,可大致分为识别、检测、分割、姿态 估计、图像文字说明等。目前高层图像理解算法已逐渐广泛应用于人工智能系统, 如刷脸支付、智慧安防、图像搜索等。
(3)三维视觉
三维视觉即研究如何通过视觉获取三维信息(三维重建)以及如何理解所获 取的三维信息的科学。三维重建可以根据重建的信息来源,分为单目图像重建、 多目图像重建和深度图像重建等。三维信息理解,即使用三维信息辅助图像理解 或者直接理解三维信息。三维信息理解可分为,浅层:角点、边缘、法向量等; 中层:平面、立方体等;高层:物体检测、识别、分割等。三维视觉技术可以广 泛应用于机器人、无人驾驶、智慧工厂、虚拟/增强现实等方向。
推荐阅读
- 山西太原把ETC收费技术引入高铁站停车交费快至0.27秒
- 长沙航院向部队输送逾六千名专业技术士官居全国高职院校之首
- [技术创新]苏州创建国家级充换电技术创新中心 助力新能源行业发展
- 黄金时间■新技术加持!江苏高标准农田灌溉效率大幅提升
- 用生物技术排地雷东北林业大学学子斩获国际金奖
- 疫苗|值得你摘下“有色眼镜”【转基因的另一面】转基因技术
- 特斯拉|热评 | 加强OTA技术召回监管将有助于汽车产业健康发展
- 一同选车|全球销冠!比亚迪的插电混动技术究竟有多强?
- 西安两男子从网上学会这种技术,竟专门用来......刑拘!
- |第七届淮海科学技术奖获奖名单揭晓121个创新项目、10名科技人才获奖
