聚焦迁移学习反向传播缺陷，百度资深工程师带来全新 ICML 工作分享 NLP在后

文章图片
CV在前， NLP在后，迁移学习技术的应用为这两个领域所带来的进展和突破，不可谓不瞩目。
其中，预训练模型作为当下迁移学习的一种主流方法，让“从零开始训练一个新模型”的时代一去不复返。这类在大型数据集上训练好的模型进行微调后，便能够较好地适配类似的新目标任务，可以极大地节约时间和成本。
不过，天下没有免费的午餐，这种方法看似“一劳永逸” ，也需要付出一定的代价，其中的一大问题便是，由于反向传播带给深层卷积层的更新较小，微调得到的模型往往被“吸引”在预训练模型附近，无法得到充分更新。
对此，百度的一篇ICML2020工作《RIFLE:BackpropagationinDepthforDeepTransferLearningthroughRe-InitializingtheFully-connectedLayEr》，提出了一种简单有效的策略RIFLE ，通过周期性的重新初始化全连接层，给深层的特征提取网络带来有意义的更新，提升低层次特征的学习，从而显著提升迁移学习的效果。
论文地址：https://proceedings.icml.cc/static/paper_files/icml/2020/3745-Paper.pdf
开源地址：https://github.com/haozhe-an/RIFLE-Paddle-Implementation
基于PaddlePaddle的实现：https://github.com/haozhe-an/RIFLE-Paddle-Implementation
【聚焦迁移学习反向传播缺陷，百度资深工程师带来全新 ICML 工作分享】据悉，该方法已超过已有同类方法如Dropout、Dropconnect、StochasticDepth、DisturbLabel以及CyclicLearningRate等，在多个数据集上的效果提升0.5%-2% 。
为了深度解析这项工作背后的算法原理以及应用效果， AI科技评论特别邀请到了论文一作、百度大数据实验室资深工程师李兴建，来做论文直播分享！
时间就定在7月24日20:00整，各位同学记得准时收看~
分享主题：RIFLE算法：通过重新初始化全连接层加深迁移学习中的梯度反向传播
分享嘉宾：李兴建，百度大数据实验室资深工程师，多年自然语言处理、深度学习、迁移学习等领域工作经验
分享时间：7月24日（周五晚）20:00整

文章图片
分享背景：
基于一个预训练的深度学习模型进行微调，成为一种主流的迁移学习方式。该方法虽然简单有效，但微调得到的模型经常被『吸引』在预训练模型附近，无法得到充分更新。我们的工作提出一种简单有效的策略RIFLE ，通过周期性的重新初始化全连接层，给深层的特征提取网络带来有意义的更新，提升低层次特征的学习。

聚焦迁移学习反向传播缺陷，百度资深工程师带来全新 ICML 工作分享

推荐阅读

零食一天最多吃3次

相关|中国人寿财险两支公司合计被罚45万元

退市|突然退市！其产品风靡一时！范冰冰、李敏镐等巨星曾代言

淘宝上如何投诉侵权淘宝店收到法院传票怎么办

数学|二年级数学第6单元，乘法口诀越来越难，3个知识点别忽视了

祁门红茶有点香味,祁门红茶养生产品

『小孩』小孩嘴干起皮怎么办

连增|远大特材新增4条被执行信息，执行标的超6900万

王者荣耀怎么打开麦克风，王者荣耀怎么开麦放歌让队友听到

火炮旅游达人|足以引起世界轰动，印媒大胆预测：中国会发生三件事

「小彭说机」Ace2值不值？，卖掉小米10，入手OPPO

农业|叮咚买菜关联公司新增农业科技领域内的技术开发等业务

苏眠月英飞凌芯片：自主核心在华供货不受影响，美国芯片企业获销售许可

新手怎么挑选手串好看新手怎么挑选手串好看的

「娱乐时该」当他和尹正穿赛车服同台，身材瞬间真相了，王一博骨架到底有多小

『F-35』这才是美军头号对手，F35战机组装厂被迫停工，军方看了也无能为力

限制|原创与郑爽分手后官司缠身！张恒被限制消费，多名员工起诉讨薪

秦岚|43岁秦岚近照曝光，一刀切短发利落职场范，瘦到极致双腿似竹竿

骁龙870|骁龙870+LCD直屏！曝iQOO Neo5活力版售价不到两千

普洱熟茶怎样存放,怎样冲泡普洱熟茶才会更好喝