|零门槛的AI开发课程!2020 WAIC开发者日百度公开课核心干货( 三 )
杜宇宁重点分享了 PaddleCV 模型库以及几个典型的端到端开发套件 。 PaddleCV 是飞桨针对计算机视觉领域打造的一个模型库 , 覆盖了图像分类和目标检测、图像分割、视频分类和动作定位、文本识别、度量学习、关键点检测、图像生成、3D 视觉以及模型压缩这些方面 。 提供了我们常见的这些场景的模型训练方法和使用的预训练模型 。 在上述基础上又打造了一系列端到端的开发套件 , 包括 PaddleClas 的图像分类套件、PaddleDetection 目标检测套件、PaddleOCR 的文本识别套件等等 。
本文插图
飞桨近期推出的 PaddleClas 图像分类套件是面向工业界和学术界的图像分类任务工具集 。 PaddleClas 的模型库非常丰富 , 包括了 23 个系列的分类网络以及训练配置 , 提供了 117 个模型在 ImageNet 数据集上的预训练模型和性能评估 , 这也是目前所知的业界丰富度最高的分类代码库 。
此外 PaddleClas 还提供了一个 SSLD 蒸馏方案以及 8 种数据增广方法 , 帮助使用者提升图像分类的效果 。 SSLD 蒸馏方案已将 ResNet 50 系列模型的精度提升到了 82.4% , 是目前开源里面精度最高的 ResNet50 模型 。 最新的代码库中 , 该模型的精度已经进一步从 82.4% 提升到 83% 。
PaddleClas 的 github 地址:https://github.com/PaddlePaddle/PaddleClas
本文插图
PaddleDetection 套件则提供了多种模块化设计的检测性模块 , 预置了多种数据增强方式、组件以及损失函数 , 可与产业应用无缝衔接 。 在该套件中 , 对 YOLOv3 模型进行深度优化 , 精度提升至 43.6% , 与原作比 , 提升 10.6% 。 此外 , 针对移动端 , 嵌入式这些端侧应用 , 提供了基于 SSD(骁龙 845 预测耗时 41ms , mAP 16.6%)、YoloV3(骁龙 845 预测耗时 110ms , mAP 25.9%)、Faster RCNN(骁龙 845 预测耗时 376ms , mAP 30.2%)的不同优化方案 , 以满足不同场景对速度和精度的要求 。 此外它提供了 PaddleSlim 模型压缩和 Paddle Inference 的集成 , 让检测任务实现在企业中轻松部署 , 可支撑当前工业质检、遥感图像检测、无人巡检等多方面的产业应用 。
PaddleDetection 的 github 地址:https://github.com/PaddlePaddle/PaddleDetection
本文插图
PaddleOCR 套件是百度推出的旨在打造丰富领先实用的文本识别模型的工具库 。 目前 PaddleOCR 主要开源包括了两种业界领先的检测算法「EAST」和「DB」 , 以及包括 CRNN 在内的四种文本识别算法 。 此外还打造一个大小仅为 8.6M 的超轻量级中文 OCR 识别模型 , 和一款效果更好的通用中文 OCR 模型 。 目前 , 百度自研的检测算法 SAST 以及识别算法 SRN 也在适配过程中 , 近期也将在 PaddleOCR 内开源 。
本文插图
【|零门槛的AI开发课程!2020 WAIC开发者日百度公开课核心干货】
下面介绍了一下 8.6M 超轻量级中文 OCR 模型 。 超轻量模型的特点就是运行时显存 / 内存占用更小 , 计算量更少 , 从而使用更加方便 。
本文插图
上面表格的预测耗时没有包括预处理时间 , 近期 PaddleOCR 项目给出最新的超轻量中文模型(8.6M)在各平台的预测部署方案以及预测耗时 benchmark 如下:
推荐阅读
- 人工智能|敏捷开发框架的开发运用之智能办公管理系统的开发
- NASA|NASA第一款登月漫游车曝光!或与日本丰田汽车联合开发制造
- 环球Tech|室内飞无人机担心互撞?研究人员开发AI算法来防撞
- 主播|有机构399元“造神” 无门槛入门or入坑
- 行业互联网|Wenco和Oxbotica合作开发采矿业的第一个开放式自主解决方案
- 趣头条|加入电竞俱乐部门槛太高?小伙伴可来家门口的电信营业厅自组赛事
- 亡城孤影|区块链otc跨境支付系统平台开发usdt承兑商支付系统搭建
- 中年|西青开发区文创及新媒体产业沙龙在赛达招商中心成功举办!
- 3DMGAME资讯号|开发者:XSX和PS5的硬件性能不重要 利用率更重要
- 世代|微软:不强制跨世代,次世代独占是开发组自己的选择