那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战
导语:百万日活的推荐是很多人可望而不可求的 , 其的设计也并不简单 , 那么该如何设计这样一款推荐呢?本文基于自己的实际搭建经验 , 为我们了他的产品设计历程 , 希望能够帮助大家在搭建的过程中少走一些弯路 。
文章图片
前言:
本系列专栏主要讲述本人从0到1搭建RES推荐的一些经验 , 记录下产品设计的心路历程 , 以此激励自己不断探索新知识 。
与市面上泛泛而谈的博客不同的是 , 本文主要从产品的角度 , 结合行业特性 , 剖析踩过的坑 。
一、产品架构
【那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战】任何一款再简单的产品 , 都需要商业模式和产品架构的设计 。 架构不需要多么复杂、花哨 , 深入理解行业背景 , 适合产品规划才是最重要 。
文章图片
用visio画的一个比较满意的产品图 , 基本能把要表达的思路全部画了出来 。
不同于前任设计的基于规则的1.0版本 , 这次重构主要在于搭建一个可扩展的体系 , 同时引入数据驱动、算法赋能 , 而不是拍脑袋决定 。
从产品的角度看推荐 , 应属于业务应用层 。
推荐的整体流程分为召回、过滤、排序(因为数据量不是非常大 , 所以不需要粗排、精排)重排序 , 这次主要讲召回层最易理解但最重要的热门召回 。
二、整体流程
文章图片
【那么该如何设计这样一款推荐系统呢,1,—大智慧RES从0到1实战】根据整体流程 , 发现核心在于热门值的计算方案 。
资讯热度分=初始热度值+用户交互产生热度值-低质量惩罚分暂无*时间衰减系数 。
1. 初始热度值
1不同类别的文章给与不同的权重
根据用户数据反馈 , 选择其中某些热门主题类型的文章 , 同时综合考虑高质量的类目 , 给与较高的权重 。
类别初始热门值:
2人工构建热门词库
新媒体的专家是最懂行业 , 最懂当前热点的了 , 引入人工规则 , 维护一张热门词库 。
文章图片
字段类型说明:
热词idstring自增 , 主键热门词string不可为空 , 不可重复状态string枚举值:
对文章进行提取关键字 , 进行匹配 , 根据匹配程度适当提升热门权重 。 提取关键字的算法也很简单 , 利用textrank , 弥补tf-idf无法提取上下文关系的劣势 , 取共现词topN 。
作为关键词 , 当然前置工作有去除停用词 , 后置工作有同义词归并等等 , 所以NLP的底层基础能力很重要 。
3自动发现热词
2. 交互热度值
取前M小时用户的不同行为赋予不同的分数 , 如【具体分值根据数据表现配置】
几个核心的点:
评论:无法单一的根据内容得出用户的偏好 。 需要对内容做正负面分析 。
采用经典的hacker news的排行算法:
推荐阅读
- 湖人队|扎心?一张图看湖人如何应对马赛克三分雨,神龟5米范围没人理他
- 搜狐新闻|准大学生数码三件套如何选?这些元气好物值得种草
- 穿搭|秋天那么短就别买新衣了!用这3招,几年前的旧衣也能穿出新感觉
- 想好好做医生的胖子|五十岁女性经常有周身无力和疼痛的困扰!该如何应对?医生告诉您
- 儿童饮食|秋冬季如何让宝宝爱上吃水果?稍微蒸一下美味翻倍,营养价值更高
- 队员|北极科考中“遭遇”北极熊,看科考队员如何与它们和谐相处
- 中国历史发展过程|中国历史发展过程!中国游戏外挂发展史:“辅助工具”是如何成长为“苍
- 金色年华录|都是男扮女装谈恋爱,《少女大人》比《女世子》如何?
- 上海市嘉定区人民政府网站|每年消耗3350吨蔬菜150吨肉,嘉定这家中央厨房如何践行“光盘行动”?
- 上海嘉定|如何让《民法典》走进群众心里?嘉定这些街镇和单位这样做
