|ECCV 2020最佳论文讲了啥？作者为李飞飞高徒邓嘉( 二 )

这个数据集也成为许多光流预测网络必备的数据集之一。
然而，上述基于深度学习的经典光流预测算法，存在着几个缺点，无论怎么优化，这些缺点都会因为框架自身而一直存在。
但在RAFT ，这个全称光流循环全对场变换的框架中，过往的3大缺点都被一一解决了：
突破局限，三点创新
第一，先前的框架普遍采用从粗到细的设计，也就是先用低分辨率估算流量，再用高分辨率采样和调整。
【|ECCV 2020最佳论文讲了啥？作者为李飞飞高徒邓嘉】相比之下， RAFT以高分辨率维护和更新单个固定的光流场。
这种做法带来了如下几个突破：低分辨率导致的预测错误率降低，错过小而快速移动目标的概率降低，以及超过1M参数的训练通常需要的迭代次数降低。
第二，先前的框架包括某种形式上的迭代细化，但不限制迭代之间的权重，这就导致了迭代次数的限制。
例如， IRR使用的FlowNetS或PWC-Net作为循环单元，前者受网络大小（参数量38M）限制，只能应用5次迭代，后者受金字塔等级数限制。

本文插图

相比之下， RAFT的更新运算是周期性、轻量级的：这个框架的更新运算器只有2.7M个参数，可以迭代100多次。
第三，先前框架中的微调模块，通常只采用普通卷积或相关联层。
相比之下，更新运算符是新设计，由卷积GRU组成，该卷积GRU在4D多尺度相关联向量上的表现更加优异。
光流预测的效果
话不多说，先上RAFT光流预测的效果图。
这是在Sintel测试集上的效果展示，最左边是真值，最右边是RAFT预测的光流效果，中间的VCN和IRR-PWC是此前效果较好的几种光流预测框架。

本文插图

可以看出，相较于中间两个框架的预测效果， RAFT的预测不仅边界更清晰，而且运动的大小和方向准确（看颜色）。
此外，在KITTI数据集上的预测效果也非常不错。
图左的几辆小车被清楚地预测了出来，而图右中，驾驶方向不同的车辆也能用不同的颜色（红、蓝）区分标记。

本文插图

不仅小视频，在1080p的高分辨率视频（DAVIS数据集）中，光流预测的效果也非常不错。

本文插图

有意思的是，在训练参数（下图横轴）几乎没有明显增加的情况下， RAFT在一系列光流预测框架中， EPE误差（下图纵轴）做到了最小。

本文插图

由上图可见，团队同时推出了5.3M参数量和1.0M轻量级的两个框架， EPE误差效果均非常好。
从效果来看，在KITTI数据集上， RAFT的F1-all误差是 5.10% ，相比此前的最优结果（6.10%）减少了16%；在Sintel数据集上， RAFT只有2.855像素的端点误差（End-Point-Error），相比先前的最佳结果（4.098 像素）减少了30% 。
不仅推理效率高，而且泛化能力强，简直就是光流预测中各方面超越SOTA的存在。
那么， RAFT的框架究竟是怎么设计的呢？
高性能端到端光流网络架构
从图中可见， RAFT框架主要由三个部分构成：特征编码器、相关联层（correlation layer）和基于GRU的更新运算器。

|ECCV 2020最佳论文讲了啥？作者为李飞飞高徒邓嘉( 二 )

推荐阅读

台湾五粮液哥称大陆将出现粮荒|台湾五粮液哥称大陆将出现粮荒怎么回事？五粮液哥奇葩言论

中央汇金：不存在涉及中信建投未披露的重大信息

解锁|三星Galaxy Z Fold3严防解锁root：会导致摄像头不可用失去保修

Angelababy|baby杨颖与男星关喆24小时两大瓜：被曝现身酒吧，一起滑雪游玩

上观新闻|上海房地产经纪行业协会提示：警惕收房租金过高

齐达内|0-2落后，上19岁球员？齐达内神换人再创奇迹，巴萨惨败不冤

养生名医团|增强体质少生病，老年人营养不良易生病！饮食需牢记这5点

『运城新观察』寻找尸源！平陆黄河大桥下发现一具无名女尸（内附死者照片)

四川|男子凌晨2点掉入3米深护城河四川青神守夜干部负伤救起他

看看资讯|丁当压力大伤心落泪，有谁注意许飞？，乘风破浪的姐姐：张雨绮话多

小乖麻星座|愿陪你到地老天荒，6月3星座痴情守候

卡哇伊|蛇.龙.马.三大生肖接到财神爷，财气冲天，业绩飞升不停！，7月27号28号29号

八爪猫ENT|谦嫂抱怨婚姻不顺，孟鹤堂孙越紧接着空降节目组，无疑是火上浇油

唐宋八大家为什么没有李白和杜甫？

津云|他是怎么如何调整阿7的，苏亚雷斯是王宝山的阳谋

时尚界拍■今年时兴“瑜伽裤”，时尚达人都这样穿，烟管裤已经不流行了

『孕妇内衣排行榜』2017年孕妇内衣排行榜分析报告

生完瘦不下来？产后塑形，大部分妈妈都做错了

中国侨网|驻曼彻斯特总领馆就中国学生返校安全约谈曼彻斯特大学负责人

经济晚报速新闻|不该！抚州一公交车司机当众辱骂女乘客