现在有没有关于GAN在深度增强学习的迁移学习中的应用
概念有点混乱。深度增强学习、GAN、迁移学习是独立的机器学习范式吧,它们各自有各自的算法和模型。
把强化学习与深度学习技术结合产生深度强化学习。
增强学习中的策略梯度算法用于GAN,构造一个reward,解决GAN用于离散的场景下(NLP中序列处理问题)梯度不能从判别器D传播到生成器G的问题,典型的如SeqGAN。
增强学习用于迁移学习、多任务学习是很常见的。典型论文:
Actor-Mimic: Deep Multitask and Transfer Reinforcement Learning, E. Parisotto, et al., ICLR, 2016.Policy Distillation, A. A. Rusu et at., ICLR, 2016.ADAAPT: A Deep Architecture for Adaptive Policy Transfer from Multiple Sources, J. Rajendran et al., arXiv, 2015.Universal Value Function Approximators, T. Schaul et al., ICML, 2015.深度强化学习应用的更多最新论文,可以参考:\u0026amp;amp;amp;amp;lt;纯干货-5\u0026amp;amp;amp;amp;gt;Deep Reinforcement Learning深度强化学习_论文大集合 - 专栏,我之前整理的,很全。
迁移学习介绍可以看下我专栏的这篇文章:深度学习模型-13 迁移学习(Transfer Learning)技术概述 - 专栏
最近在整理迁移学习、多任务学习等知识,可以关注我的专栏。
欢迎扫描我的头像关注公众号“深度学习与NLP”获取更多内容。
■网友
有的。比如,在领域自适应 domain adaptation 这一迁移学习分支的问题上,google brain 团队就尝试使用 gan 将 source domain 的数据通过加噪使用一个 generator 生成近似 target domain 的分布的一项工作: pixel domain adaptation, 这项工作在像素级处理这个问题,取得了很好的效果。在 CVPR 2017 上有对应的 presentation.除此之外,google brain 团队去年还发表了一篇 domain separation networks,连同 2014 年的那篇 domain adversarial networks ,基本可以让你对领域自适应这个问题的处理方式和对抗这一理念是如何结合进来的,以及现在火的不行的 gan 是如何在各个地方发挥作用的。说句题外话,gan 虽然在视觉领域的各种逆天,但在语音上,取得的成果还没有那么多。
■网友
这篇文章还不错,希望能够帮到你:
【现在有没有关于GAN在深度增强学习的迁移学习中的应用】 GAN+增强学习, 从IRL和模仿学习, 聊到TRPO算法和GAIL框架, David 9来自读者的探讨,策略学习算法填坑与挖坑
■网友
在arxiv上搜下关键词应该就有了
推荐阅读
- 过节■江苏省委省政府办公厅下发关于做好2021年元旦春节期间有关工作的通知
- OC为何跌出语言榜前十
- 坐标合肥,请问在哪里能捕捉到程序员这种生物他们大都出现在哪里呢
- 知乎有没有必要增加一个特别关注功能
- |徐州市出台《关于优化创新创业生态系统 提升区域科技创新活力的实施意见》及实施细则
- 雨下|全球关于禁售燃油车只是理论上可行吗
- 现在在线学习视频有很多了,为啥大部分人还是喜欢下载下来观看
- dart这编程语言现在发展怎么样了,语法与Java,c#很相似,甚至更简洁
- 为啥到现在你还没有女朋友 ?
- 白皮书一般是政府发布的正式报告或文件,那么现在物联网、智慧城市等热门领域这么多企业发布的白皮书算咋回事呢
