量子位机器学习人门贴送上，看完发现RNN原来是这样白交发自凹非寺量子位报道|公众号QbitA

白交发自凹非寺
量子位报道|公众号QbitAI
今天写给小白的机器学习入门贴，就来介绍一下什么是循环神经网络，也就是RNN 。
循环神经网络就是专门处理序列的。由于它们在处理文本方面的有效性，因此经常用于自然语言处理（NLP）任务。
还是之前介绍的那个作者——VictorZhou 。

文章图片
RNN有什么用？
传统的神经网络，以及CNN ，它们存在的一个问题是，只适用于预先设定的大小。
通俗一点，就是采用固定的大小的输入并产生固定大小的输出。
就比如上次提到的CNN例子，以4×4图像为输入，最终指定输出2×2的图像。
而RNN呢？它专注于处理文本，其输入和输出的长度是可变的，比如，一对一，一对多，多对一，多对多。
看这个图，我想你就可以明白了。

文章图片
其中，输入是红色、RNN本身是绿色，输出为蓝色。
这种处理序列的能力十分有用，于是， RNN就有了丰富的应用场景。
比如，机器翻译。
像你见到的，某歌、某道、某度，还有最近很火的DeepL翻译器，它们都是“多对多”进行的。
原始文本序列被馈送到RNN ，然后RNN生成翻译后的文本作为输出。
再比如，情绪分析。
通常使用的是“多对一”的RNN进行。将想要分析的文本输入到RNN中，然后产生一个单一的输出分类。
举个例子：分析一个评论是正面还是负面的评论。
输出得出：这是一个肯定的评论。
怎样实现RNN？
我们就先来考虑一下， “多对多的RNN ，输入为x0、x1、x2……xn ，输出为y0、y1、y2……yn ，这些xi ， yi都是向量，具有任意维度。
RNNs的工作原理是迭代更新一个隐藏状态h ，它是一可以有任意维度的向量。
而对于任意的一个ht：
1、由对应的输入xt与上一个隐藏层ht-1来计算2、输出yt是由ht计算出的结果。
这样，前一次的输出结果，就会带到下一次的隐藏层中，跟着一起训练。这样看，是不是就感受到了循环二字了。

文章图片

文章图片
每一个步骤都是采用的相同的权重，通常来讲，一个典型的RNN通常只需3组权重去完成它的计算。

文章图片
此外，还需要两个偏差。

文章图片
【量子位机器学习人门贴送上，看完发现RNN原来是这样】由此，这3个权重跟2个偏差，就完成了整个RNN的计算。
将他们组合起来，方程式是这样的。

文章图片
需要注意的是，这里的权重是矩阵，而其他变量是向量哦！
这里的第一个方程式，激活函数采用的是双曲线函数，当然用之前提到的S型函数也是OK的。
文本是肯定还是否定？
接着，我们就来试着从头开始执行RNN吧。
以一个简单的情感分析为例，就是判断一串给定的文本字符串是肯定的表达还是否定的。
比如，这些数据集。

文章图片
从这个表格看出，我们将使用“多对一”的RNN类型。

文章图片
每个输入x都将是一个向量，代表文本中的一个单词。
而输出y则是一个包含两个数字的向量，一个代表正数，一个代表负数，然后应用Softmax将这些值转化为概率，并最终得出正负。

量子位机器学习人门贴送上，看完发现RNN原来是这样

推荐阅读

“不是说爱我吗，多照顾一个人而已，怎么做不到”“还是离婚吧”

新民晚报|“朋友圈”新增9座长三角城市！长三角资本市场服务基地服务科创板“晒”出一年成绩单

当硅胶脸混进谍战剧，对比天然脸演员，真是没有对比就没有伤害

对马岛之魂|《对马岛》E3宣传片对比实机看看“缩水”严重么

励志司机锐锐|零零后的美文：理想三旬

『干扁蚕蛹』干扁蚕蛹这样做更好吃

新年又一大瓜，顶流歌星美国俩娃，大的已有十几岁

注意看过来，洗衣机在家居风水中还大有学问

小城讲历史|一攻两防！詹姆斯绝杀快船，35岁了，他还是联盟第一人

俄罗斯|俄罗斯和印度达成一项协议，让我们彻底醒悟，真正可靠的只有自己

大众报业·大众日报客户端|观澜丨盐通高铁提速试验385公里！为啥说这条高铁对胶东意义深远？

拳头|LOL新英雄涉嫌抄袭？一少女表示自己已聘请律师，打算对簿公堂！

俗话说：“穷看碗里富看穿，大户人家看门前”，为何穷人要看碗呢

「做饭小七七」夏天最便宜的菜，此种做法清淡又美味，经常吃点，营养丰富

大神的人体结构图人体解破图

羊绒|羊绒围巾的围法，让你的气质增涨一倍

伦敦电影学院读研条件纽约电影学院

观众|竞秀养成：没有血雨腥风的“大逃杀”

「特朗普」就只差三票！特朗普败了！美国最高法院对特朗普下手了

海外网|海评面：盐水鸭、普洱茶……中国特产在欧洲有了“官方认证”

量子位 机器学习人门贴送上，看完发现RNN原来是这样

推荐阅读

量子位机器学习人门贴送上，看完发现RNN原来是这样