啥是Pointer Network
Pointer network 主要用在解决组合优化类问题(TSP, Convex Hull等等),实际上是Sequence to Sequence learning中encoder RNN和decoder RNN的扩展,主要解决的问题是输出的字典长度不固定问题(输出字典的长度等于输入序列的长度)。
在传统的NLP问题中,采用Sequence to Sequence learning的方式去解决翻译问题,其输出向量的长度往往是字典的长度,而字典长度是事先已经订好了的(比如英语单词字典就定n=8000个单词)。而在组合优化类问题中,比如TSP问题,输入是城市的坐标序列,输出也是城市的坐标序列,而每次求解的TSP问题城市规模n是不固定的。每次decoder的输出实际上是每个城市这次可能被选择的概率向量,其维度为n,和encoder输入的序列向量长度一致。如何解决输出字典维度可变的问题?Pointer network的关键点在如下公式:
其中
是encoder的在时间序列j次的隐藏层输出,
是decoder在时间序列i次的隐藏状态输出,这里的
其维度为n维和输入保持一致,对
直接求softmax就可以得到输出字典的概率向量,其输出的向量维度和输入保持一致。其中
均为固定维度的参数,可被训练出来。
■网友
参照 视频 李宏毅深度学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili
■网友
【啥是Pointer Network】 
point: The output dictionary.
■网友
不好意思,我不知道。。。
推荐阅读
- 啥是微信开发WEB前端
- 邻接表的占用空间为啥是m+n? 为啥鉴别所有edge是Θ(m+n)? 求大神指教
- 目前在做程序化购买的运营投放工作,去trading desk还是去adnetwork对个人发展较好
- 啥是网红脸你咋看待网红脸们
- 懒投资的群星计划到底算啥是股票么怎样评价群星五号今年一号开始后的狂跌
- 啥是大数据时代。啥又叫做云商。?
- 能否详细解释下啥是“舆情分析”,互联网方面的。以及关于这方面的技术和工具
- 啥是非标品类目
- 注册Facebook,验证手机号码时收到的验证码发送方为啥是中国嘉兴的
- 啥是免费ARP数据包?
