社交网络中的feed/timeline的排序算法怎样设计

如果想用机器学习的方法来做的话,最关键的是如何收集训练数据,没有label再好的方法也没用。也就是说如何了解用户对于某一个timeline排序方法的反馈,这个之中不同的系统的case相差很大,要处理很多因素,比如position bias和如何定义正负反馈,以及怎么收集unbias的data做offline evaluation。其次是怎么设计feature。这里的feature主要分3大类,用户,新鲜事以及新鲜事相关的人。相应的就会有first-order的feature,以及second或者third order的feature组合。如果前两个点做的好了,一个linear model就可以解决问题了。剩下的是如何继续收集用户对算法反馈不断迭代产品了。因为这个应用比较复杂,没有什么公开数据集,一般只能在公司里面做,所以相关的论文不多,有的话也大都不靠谱。推荐一篇不错的论文 http://www.hongliangjie.com/publications/sigir2012.pdf


    推荐阅读