社交网络中的feed/timeline的排序算法怎样设计
如果想用机器学习的方法来做的话,最关键的是如何收集训练数据,没有label再好的方法也没用。也就是说如何了解用户对于某一个timeline排序方法的反馈,这个之中不同的系统的case相差很大,要处理很多因素,比如position bias和如何定义正负反馈,以及怎么收集unbias的data做offline evaluation。其次是怎么设计feature。这里的feature主要分3大类,用户,新鲜事以及新鲜事相关的人。相应的就会有first-order的feature,以及second或者third order的feature组合。如果前两个点做的好了,一个linear model就可以解决问题了。剩下的是如何继续收集用户对算法反馈不断迭代产品了。因为这个应用比较复杂,没有什么公开数据集,一般只能在公司里面做,所以相关的论文不多,有的话也大都不靠谱。推荐一篇不错的论文 http://www.hongliangjie.com/publications/sigir2012.pdf
推荐阅读
- 郑州警方查获一盘踞境外网络赌博犯罪集团冻结资金逾5亿元
- 『徐州』徐州这群留守儿童的纯净声音抚慰人心 “6秒童声合唱团”走红网络
- 鄂温克冬季马赛-30℃极寒开赛:寒冬中的火热派对
- 长春评选“网络奋斗者”:互联网成更多普通人创业工具
- 西藏首台5G网络车载移动CT仪器投用
- 大雪@大雪腌肉 适当进补 今日大雪
- 诈骗钱财|冒充专家高价兜售“特效药”、谎称卖口罩骗定金……警惕这些网络诈骗
- |电商事业中的“闪光少年”
- hadoop中的mapreduce链接(mapreduce chaining)怎样避免中间文件的产生
- 媒体聚焦网络知产保护:强化企业社会责任,完善行业监管体系
