咋形象理解embedding这个概念( 四 )

先对输入向量通过两个全连接层进行编码,然后再通过两个全连接层进行解码最后得到拟合输入向量的输出向量。该模型同样也是通过拟合已经有的打分来学习整个模型的参数,模型学习好之后,之前填充为0的物品打分就可以通过模型输出向量的对应位置得到。
虽然这个模型没有很明显的embedding思想的体现,但是以我个人对embedding的理解,在模型最终输出的用户对所有物品的打分稠密向量是否可以用来当作表示用户兴趣的user embedding向量呢?
▌总结通过这篇文章对embedding的分析,总结embedding有以下三个作用:
通过计算用户和物品或物品和物品的Embedding相似度,来缩小推荐候选库的范围。实现高维稀疏特征向量向低维稠密特征向量的转换。训练好的embedding可以当作输入深度学习模型的特征。无论embedding在模型中最终起到哪些重要的作用,在对embedding的本质理解上,它自始至终都是用一个多维稠密向量来对事物从多维度进行的特征刻画。
■网友
Embedding在数学上表示一个maping:
, 也就是一个function。
其中该函数满足两个性质:
injective (单射的):就是我们所说的单射函数,每个X只有唯一的Y对应;structure-preserving(结构保存):比如在X所属的空间上
,那么映射后在Y所属空间上同理
。那么对于word embedding, 就是找到一个映射(函数)将单词(word)映射到另外一个空间(其中这个映射具有injective和structure-preserving的特点), 生成在一个新的空间上的表达,该表达就是word representation.
■网友
embedding 可以理解为比如降维,或者说把一些复杂难以表达的特征用相对来说可以用数学表达或者更易计算的形式来表达的一种映射。比如把单词转化成向量,把数字(的奇偶正负实复等性质)转化成n维矩阵。
■网友
数学上的概念,从一个空间映射到另外一个空间,保留基本属性。
word embedding就是从一个高维空间(如:维度=词汇表长度=1M),映射到低维度空间(如300)。
■网友
最近特别忙,工作日几乎没什么时间学习。平时攒了一堆推荐相关的文章,趁周末整体学习了一下。主要是参考了网上的一篇技术文章(迄今为止我看到的比较好的推荐Embedding总结)以及我自己的一些理解。
?Embedding概念首先一些概念性的内容要科普下。推荐系统分召回和排序,召回为将每个用户找出他可能喜欢的物品的候选集,排序是对候选集按照用户的喜爱程度进行排序,最终得出给用户推荐的结果。
在推荐系统的召回阶段,需要对每个用户和每个被推荐物品做数学层面的表示,目前比较主流的方法是通过向量,也就是Embedding表示。举个例子,假设傲海和两个物品的Embedding表示法如下:
傲海=
物品1=
物品2=
相比于物品1,傲海的向量距离显然与物品2更小,在推荐系统中就会优先为傲海推荐物品1而不是物品2。这种表示方法就将推荐召回模块抽象成是否可以准确的表示每个人和物品的Embedding,越准确则推荐效果越佳。
I2I和U2I的召回方案那向量召回有哪些模式呢?其实最核心的是I2I和U2I,当然还有一些衍生的比如U2U2I,这里不再赘述。
U2I主要是通过计算人(USER)和物品(ITEM)的距离做召回,就跟我上文提到的傲海和两个物品的向量距离计算一样。U2I对算法的要求是,需要把人和物品的特征同时加入算法进行计算,这样人和物品的向量维度和意义才一致,做人和物品的向量距离计算才有意义。
推荐阅读
- 学图像处理有哪些不错的书推荐
- 应该怎样理解会员服务的法律性质
- 端口到底是啥概念和ip之间有啥关系能形象+抽象的从技术角度描述一下吗
- 王祖蓝|妻子李亚男临盆在即,王祖蓝连夜赶火车睡卧铺,头发凌乱形象邋遢
- 读书读到3分之一的时候感觉很难理解,要不要继续
- 怎样简洁到位地让外国人理解中文互联网文化中的「屌丝」、「喷子」、「五毛」、「水军」、「公知」等词
- ActiveMQ、MQTT的方式进行Android消息推送,我的理解是否正确
- |嫦娥五号升空,探月IP形象首发,北京越野向“潮牌”转型
- 讲座|启东系统培训帮助老师和家长更好理解孩子
- 冯绍峰|冯绍峰古装照曝光,神情萎靡“熊猫眼”吓人,形象气质暴跌
