靓科技解读▲自研AI集成ic,依图加快行人重识别(ReID)规模性产品化落地式,AutoML

人脸识别之后的下一个风口是什么?
对于这个问题 , 业界似乎早已有了共识 。 从AI的人脸识别能力超越人类以来 , 学术界和产业界的目光逐渐转向另一个更具科研意义和应用价值的课题——行人重识别 。
近日 , 依图科技在ReID领域取得新突破 , 刷新业界三大权威数据集当前最优成绩 , 算法性能达到业界迄今最高标准 , 极大拓展了算法和应用的边界 。
靓科技解读▲自研AI集成ic,依图加快行人重识别(ReID)规模性产品化落地式,AutoML
文章图片
还记得2018年底依图进军智能语音 , 随即在中文语音识别领域创下识别精度的新纪录 。 2019年5月推出全球首颗云端视觉AI芯片 , 而且“发布即商用” 。 似乎无论进入哪个技术领域 , 依图都能快速将行业整体水平推至新的高点 , 并加速技术的产业化落地 。
这背后的关键是什么?
行人重识别 , 人脸识别后的“杀手级应用”
在交通运输、工业制造和城市规划等实际场景下 , 99%的图像都是不含人脸或人脸部分是极其模糊的 , 仅有几个像素大小 , 这时候人脸识别的作用较为有限 。
行人重识别 , 是指在多摄像设备网络下对行人进行检索 , 利用步态动作、身体特征等更为全面的信息来识别人物 , 无论单独使用还是与人脸识别相结合 , 都能发挥更大的应用价值 。
除了智能零售、智慧交通、智能城市等经常提及的应用场景 , ReID技术的应用也将使日常生活更加便捷:游乐园更易寻找走失儿童、宠物/家庭机器人可以凭背影准确识别主人或顾客并提供相应服务 。
然而 , 由于ReID需要从不同摄像机拍摄的图像或视频中找出同一个人物 , 而这些摄像机所覆盖的范围彼此并不重叠 , 导致缺乏连贯的信息 , 而且不同画面中人物的姿态、行为甚至外观会发生较大变化 , 不同时间、场景的光照、背景和遮挡物各不相同 , 摄像机的分辨率也有高有低 , 人物在画面中出现的位置有远有进,这些都对ReID技术提出了极大的挑战 。
深度优化ReID算法框架 , AutoML取代人工算法调优
依图科技凭借自身工程与研发实力 , 深度优化了ReID算法框架 , 显著提升了算法效率 , 通过结合AutoML等前沿技术 , 进一步创新性地实现了模型参数的自动搜索与迭代 , 突破了依赖算法研究员手工设计与调优的传统算法开发流程 , 在降低人力成本的同时 , 使得算法的泛化性能更强 。
此次依图自研算法在业界最具影响力的三大ReID数据集Market1501、DukeMTMC-ReID、CUHK03上 , 将衡量算法性能的两大关键指标“首位命中率”及“平均精度均值”6项数据全部提升 , 充分显示了依图的技术实力 , 进一步稳固了中国技术团队在该任务下领跑地位 。
【靓科技解读▲自研AI集成ic,依图加快行人重识别(ReID)规模性产品化落地式,AutoML】需要指出 , 首位命中率高 , 只意味着算法能够在众多图像中准确找出最容易识别或者说匹配的那张 , 并不能反应模型的真实能力 , 尤其是应对复杂场景的表现 。
因此 , 评价ReID算法性能时需要结合mAP值 , 它反映的是系统的综合检索性能 。 mAP值越高 , 说明系统的实用性越好 , 既能查得全也能查得准 , 能够较好地应对多遮挡、光线暗、画面模糊等情况 。
算法+算力 , 加速ReID商业化落地加速
面对又一项业界纪录 , 依图团队却十分平静 。 依图研发人员表示 , 这次刷榜只是一次尝试 , 依图在工业界实战落地的ReID项目 , 其规模与问题的复杂程度已经远超三大数据集 , 可以说 , 学术界现有ReID基准已经无法体现工业界算法的最高水平 。
举个例子,Market-1501在清华大学内采集 , 行人基本上是穿短袖、短裤和裙装的亚洲人 , DukeMTMC-reID在杜克大学内采集 , ID主要是身着冬季服饰的欧美人,这些在特定场景,特定时间段采集的数据往往与真实世界中的图像分布不一致 。 在真实场景下ReID算法需要做到在跨时间段,跨场景,跨不同成像质量的图像采集设备下进行高精度的快速识别.其数据分布远远与问题复杂程度远远大于现有的学术数据集 。


推荐阅读