咋形象理解embedding这个概念( 三 ) 我觉得 @邱锡

▌传统方法虽然目前有关推荐系统的模型中深度学习越来越占据重要地位，但是embedding的重要思想却贯穿始终，在传统的推荐方法中依然可以看到embedding的影子。例如基于矩阵分解的协同过滤模型，如下图所示：

通过将用户对物品的打分矩阵Rating Matrix分解成User Matrix和Item Matrix两个矩阵相乘，我们可以把User Matrix和Item Matrix相乘分别看作是A，B，C，D四个user embedding和W，X，Y，Z四个item embedding相乘。
可以看到打分矩阵比较稀疏，说明有的user没有给item打分，因此矩阵分解的目的就是通过分解的user embedding和item embedding相乘来填充user没有打分的item，从而可以进行推荐。而模型通过user embedding和item embedding相乘拟合user已给item的打分来学习embedding参数。
如上图所示，分解的user embedding B（）和item embedding W（）相乘得到3.63要尽量接近Rating Matrix中的B行W列也就是4.0，根据这种拟合学习得到embedding，最终再根据模型学习的user embedding和item embedding相乘得到user没有给item的打分，比如Rating Matrix中的A行W列的得分为user embedding A（）和item embedding W（）相乘得到3.16.
因为模型比较简单，这里直接给出利用tensorflow实现的模型的代码：
def build_model(user_indices, item_indices, rank, ratings, user_cnt, item_cnt, lr, lamb, mu, init_value): W_user = tf.Variable(tf.truncated_normal(, stddev=init_value/math.sqrt(float(rank)), mean=0), name = \u0026#39;user_embedding\u0026#39;, dtype=tf.float32) W_item = tf.Variable(tf.truncated_normal(, stddev=init_value/math.sqrt(float(rank)), mean=0), name = \u0026#39;item_embedding\u0026#39;, dtype=tf.float32) W_user_bias = tf.concat(, 1, name=\u0026#39;user_embedding_bias\u0026#39;) W_item_bias = tf.concat(, 1, name=\u0026#39;item_embedding_bias\u0026#39;) user_feature = tf.nn.embedding_lookup(W_user_bias, user_indices, name = \u0026#39;user_feature\u0026#39;) item_feature = tf.nn.embedding_lookup(W_item_bias, item_indices, name = \u0026#39;item_feature\u0026#39;) preds = tf.add(tf.reduce_sum( tf.multiply(user_feature , item_feature) , 1), mu) square_error = tf.sqrt(tf.reduce_mean( tf.squared_difference(preds, ratings))) loss = square_error + lamb*(tf.reduce_mean(tf.nn.l2_loss(W_user)) + tf.reduce_mean(tf.nn.l2_loss(W_item))) tf.summary.scalar(\u0026#39;square_error\u0026#39;, square_error) tf.summary.scalar(\u0026#39;loss\u0026#39;, loss) merged_summary = tf.summary.merge_all() #tf.global_variables_initializer() train_step = tf.train.GradientDescentOptimizer(lr).minimize(loss) # tf.train.AdadeltaOptimizer(learning_rate=lr).minimize(loss) # return train_step, square_error, loss, merged_summary虽然模型比较简单，但是可以发现embedding的思想其实贯穿在整个模型当中。
除了基于矩阵分解的协同过滤，还有基于自编码器的协同过滤，自编码器做协同过滤的思想主要是把用户对所有物品的打分组成一个固定维度的向量（没有打分的填充为0）然后通过自编码器对该打分向量进行编码解码然后得到和该打分向量维度相同的向量，该自编码器模型的输出向量就是为了拟合输入向量。如图所示为自编码器模型：

咋形象理解embedding这个概念( 三 )

推荐阅读

非常想尿尿时却解不开裤带是一种怎么样的体验

|如何通过颜色，判断小叶紫檀的品质？

胆结石喝姜茶会怎么样,治疗胆结石茶方

清朝|乾隆七世孙戴“帝王扳指”，价值3亿，专家要求上交，他回了6个字

橘子洲杀人案-橘子洲案凶手成富翁-长沙橘子洲命案

【阿力讲星座】一生中福气不止少灾少难的三大生肖

「酱猪脚」酱猪脚的正宗的做法

懂车之后吧|想换车牌的想法可以实现，车牌不满意能否更换？只要满足这些条件

唐朝诡事录|《唐朝诡事录》胜在“诡”与“录”，古装破案剧原来可以这么猎奇

流行|古人讲究“入土为安”，宋朝又理学兴盛，为何会流行火葬？

什么是民办非企业民办非企业单位

高校辅导员有前途吗大学辅导员有前途吗

雄安新区公布2例确诊病例和3名无症状感染者活动轨迹

金融控股公司|重磅！国务院发布金融控股公司准入管理决定，11月起实施！

航班|中美间航班数量将增加一倍，增至每周8班

马上旅行，想少花点钱住酒店

产品|权益类保险资管收益率赶超公募基金，同台竞技胜算几何？

蝙蝠侠|《哥谭骑士》前16分钟实机演示蝙蝠女身材惹火

易青文史|为了报答养父创业养鸡，现状如何，当年双腿截肢爬行26年的小伙

李雯看球@球迷：NBA第一投资鬼才，眼光独到！NBA球员靠卖口罩赚得盆满钵满