埃尔法哥哥MAML-Tracker:用目标检测思路做目标跟踪?小样本即可得高准确率丨CVPR 2020
本文插图
【埃尔法哥哥MAML-Tracker:用目标检测思路做目标跟踪?小样本即可得高准确率丨CVPR 2020】编者按:目标检测与目标跟踪这两个任务有着密切的联系 。 针对目标跟踪任务 , 微软亚洲研究院提出了一种通过目标检测技术来解决的新视角 , 采用简洁、统一而高效的“目标检测+小样本学习”框架 , 在多个主流数据集上均取得了杰出性能 。
目标跟踪(Object tracking)与目标检测(Object detection)是计算机视觉中两个经典的基础任务 。 跟踪任务需要由用户指定跟踪目标 , 然后在视频的每一帧中给出该目标所在的位置 , 通常由一系列的矩形边界框表示 。 而检测任务旨在定位图片中某几类物体的坐标位置 。 对物体的检测、识别和跟踪能够有效地帮助机器理解图片视频的内容 , 为后续的进一步分析打下基础 。
本文插图
图1:目标检测与目标跟踪
跟踪任务与检测任务有着密切的关系 。 从输入输出的形式上来看 , 这两个任务是极为相似的 。 它们均以图片(或者视频帧)作为模型的输入 , 经过处理后 , 输出一堆代表目标物体位置的矩形框 。 它们之间最大的区别体现在对“目标物体”的定义上 。 对于检测任务来说 , 目标物体属于预先定义好的某几个类别 , 如图1左图所示;而对于跟踪任务来说 , 目标物体指的是在第一帧中所指定的跟踪个体 , 如图1右图所示 。 实际上 , 如果我们将每一个跟踪的个体当成是独立的一个类别的话 , 跟踪任务甚至能被当成是一种特殊的检测任务 , 称为个体检测(Instance Detection) 。
由于这种紧密的关系 , 近年来 , 许多目标检测的技术同样能在目标跟踪领域大放异彩 。 例如检测中的区域推荐网络(RPN)模块 , 就被双路网络跟踪框架 SiamRPN 所借鉴;基于优化的 IoUNet 检测模块 , 也在 ATOM 等跟踪框架中取得了非常惊艳的效果 。 这些成功的应用启发我们:与其在跟踪器中使用一些检测器的模块 , 我们能否直接将检测器直接应用于目标跟踪任务?
解决小样本问题
用检测器模型去解决跟踪问题 , 遇到的最大问题是训练数据不足 。 普通的检测任务中 , 因为检测物体的类别是已知的 , 可以收集大量数据来训练 。 例如 VOC、COCO 等检测数据集 , 都有着上万张图片用于训练 。 而如果我们将跟踪视为一个特殊的检测任务 , 检测物体的类别是由用户在第一帧的时候所指定的 。 这意味着能够用来训练的数据仅仅只有少数几张图片 。 这给检测器带来了很大的障碍 。
在深度学习中 , 解决训练数据不足常用的一个技巧是“预训练-微调”(Pretraining-finetune) , 即大数据集上面预训练模型 , 然后在小数据集上去微调权重 。 但是 , 在训练数据极其稀少的时候(仅有个位数的训练图片) , 这个技巧是无法奏效的 。 图2展示了一个检测模型预训练过后 , 在单张训练图片上微调的过程:尽管训练集上逐渐收敛 , 但是检测器仍无法检测出测试图片中的物体 。 这反映出了“预训练-微调”框架的泛化能力不足 。
本文插图
图2:“预训练-微调”框架的泛化能力不足
为了解决训练数据不足的问题 , 我们引入了“与模型无关的元学习”(Model-agnostic meta-learning, MAML) 。 这个算法是近年来比较主流的小样本学习(few-shot learning)算法 。 它的核心思想是 , 学习一个好的模型初始化权重 , 使得模型能够在极少量的数据上面做几步更新就收敛到一个非常好的结果 。
在大数据集上预训练网络权重的时候 , MAML 算法采用了双层优化(Bilevel optimization)的策略 。 在每一轮迭代中 , 我们将一组训练样本分为支撑集(Support set)以及目标集(Target set) 。 检测器模型先在支撑集上面去进行固定次数的梯度下降迭代(一般为5步) , 再将更新过后的模型参数应用在目标集上 , 计算目标集上的误差 。 整体流程如图3所示 。 在支撑集上 , 固定次数的梯度下降过程称为里层优化(Inner-level optimization);由目标集上的误差去更新模型参数的过程 , 称为外层优化(Outer-level optimization) 。 与普通的 SGD 方法相比 , MAML 算法并不要求找到一组参数 , 直接使得目标集上误差最小;相反的 , 它希望找到一组参数 , 使其经过几步梯度下降迭代之后 , 在目标集上误差最小 。 这种双层优化的方式 , 迫使检测器能够通过在支撑集上的训练 , 泛化到目标集上 。
推荐阅读
- 「」儿童节就送阿尔法蛋学习手表,安全贴心又能学习
- -悟空哥哥-618年中大促力来袭,iQOO Neo3应该是你不容错过的5G手机
- 埃尔法哥哥面对用户需求与AI技术之间的不平衡,AI产品经理该如何做?
- 埃尔法哥哥谁说机器学习难?它在这朵云上就没有门槛
- 埃尔法哥哥Python基础语法之“数据应用”
- 埃尔法哥哥Bionumerics软件的多位点VNTR分析
- 埃尔法哥哥一个例子就能读懂大数据,原来数据分析能在这些行业里使用
- 埃尔法哥哥C++程序员的职业生涯规划
- 埃尔法哥哥数据规范之代码表
- 埃尔法哥哥U盘插在手机的充电器上会怎么样?为什么?