深度学习中的图像分割:方法和应用( 二 )


DeepLab 使用DeepLab的一个主要动机是在帮助控制信号抽取的同时执行图像分割 —— 减少样本的数量和网络必须处理的数据量 。另一个动机是启用多尺度上下文特征学习 —— 从不同尺度的图像中聚合特征 。DeepLab使用ImageNet预训练的ResNet进行特征提取 。DeepLab使用空洞卷积而不是规则的卷积 。每个卷积的不同扩张率使ResNet块能够捕获多尺度的上下文信息 。DeepLab由三个部分组成:

  • Atrous convolutions — 使用一个因子,可以扩展或收缩卷积滤波器的视场 。
  • ResNet — 微软的深度卷积网络(DCNN) 。它提供了一个框架,可以在保持性能的同时训练数千个层 。ResNet强大的表征能力促进了计算机视觉应用的发展,如物体检测和人脸识别 。
  • Atrous spatial pyramid pooling (ASPP) — 提供多尺度信息 。它使用一组具有不同扩展率的复杂函数来捕获大范围的上下文 。ASPP还使用全局平均池(GAP)来合并图像级特征并添加全局上下文信息 。
SegNet neural network 一种基于深度编码器和解码器的架构,也称为语义像素分割 。它包括对输入图像进行低维编码,然后在解码器中利用方向不变性能力恢复图像 。然后在解码器端生成一个分割图像 。
深度学习中的图像分割:方法和应用

文章插图
 
图像分割的应用图像分割有助于确定目标之间的关系,以及目标在图像中的上下文 。应用包括人脸识别、车牌识别和卫星图像分析 。例如,零售和时尚等行业在基于图像的搜索中使用了图像分割 。自动驾驶汽车用它来了解周围的环境 。
目标检测和人脸检测这些应用包括识别数字图像中特定类的目标实例 。语义对象可以分类成类,如人脸、汽车、建筑物或猫 。
  • 人脸检测 - 一种用于许多应用的目标检测,包括数字相机的生物识别和自动对焦功能 。算法检测和验证面部特征的存在 。例如,眼睛在灰度图像中显示为谷地 。
  • 医学影像 - 从医学影像中提取临床相关信息 。例如,放射学家可以使用机器学习来增强分析,通过将图像分割成不同的器官、组织类型或疾病症状 。这可以减少运行诊断测试所需的时间 。
  • 机器视觉 - 捕捉和处理图像,为设备提供操作指导的应用 。这包括工业和非工业的应用 。机器视觉系统使用专用摄像机中的数字传感器,使计算机硬件和软件能够测量、处理和分析图像 。例如,检测系统为汽水瓶拍照,然后根据合格 - 不合格标准分析图像,以确定瓶子是否被正确地填充 。
视频监控 — 视频跟踪和运动目标跟踪这涉及到在视频中定位移动物体 。其用途包括安全和监视、交通控制、人机交互和视频编辑 。
  • 自动驾驶 自动驾驶汽车必须能够感知和理解他们的环境,以便安全驾驶 。相关类别的对象包括其他车辆、建筑物和行人 。语义分割使自动驾驶汽车能够识别图像中的哪些区域可以安全驾驶 。
  • 虹膜识别 一种能识别复杂虹膜图案的生物特征识别技术 。它使用自动模式识别来分析人眼的视频图像 。
  • 人脸识别 从视频中识别个体 。这项技术将从输入图像中选择的面部特征与数据库中的人脸进行比较 。
零售图像识别这个应用让零售商了解货架上商品的布局 。算法实时处理产品数据,检测货架上是否有商品 。如果有产品缺货,他们可以找出原因,通知跟单员,并为供应链的相应部分推荐解决方案 。
英文原文:https://missinglink.ai/guides/computer-vision/image-segmentation-deep-learning-methods-Applications/




推荐阅读