评论审核机制有哪些
我所负责的某小说阅读器前段时间可谓饱受垃圾广告信息的困扰,因为图书有个书评区,是为了方便用户交流读后感所设,但是因为发布完全没有任何限制,所以一些广告一天可以被刷上几千条,书评区一片惨不忍睹,也严重影响了用户交流的欲望。其实我们产品有名评论审核员,但是也没办法做到实时删除,所以我开始想解决下这个问题,有些细节可能各个平台的解决方案是不一样的,但是总体思路应该是一样的,希望能够给你一些参考。首先我的需求是:用户发布评论都需要进行机审,但我非常不喜欢发布后给他弹出一个toast“待审核”,所以我希望的是在机审未完成前或失败后,此条评论仅对发布者可见,机审成功后,此条评论对所有用户可见。也就是说,用户发布后,他会感觉已经发布成功,但是为了避免垃圾信息问题,其他用户是先看不到的,这样一方面不会影响用户交流的积极性,另一方面把机审后置,可以避免审核时间过长用户需要等待。机审的维度主要分为以下几个维度:用户发布次数限制重复内容过滤广告词,敏感词,屏蔽词白名单用户,黑名单用户1. 用户发布次数限制(主要限制一名用户不可以无限制地发送评论):
同一用户1分钟内最多发送1条评论;1小时内最多发送10条评论,1天最多发送30条评论;
评论次数超出时弹出toast“发言太多累了吧,请休息下”;
其实这个限制上线后,发现发广告的人会不断注册新号来规避这个问题,后续可以考虑再加上,新用户需注册多长时间才可发布评论,或需绑定手机号才可以发布评论这些严格的条件:2. 重复内容过滤(许多发布广告的内容都是差不多的,限制这个十分有效):对比时去掉除汉字外的任何符号,如“淘,宝”、“微sjenbs信”,对比时用“淘宝”“微信”;
将评论与同一用户上条评论作对比,10个汉字以上的若与其中一条重复率达70%(20,60%;30,50%)则弹出toast“请不要发布重复内容”;
同时将评论仅与评论库最近发布50条的评论作对比,20个汉字以上的若与其中一条重复率达80%则机审失败(30,70%;50,60%);
在对比重复内容时一定要去掉一些无关的符号,因为很多小广告喜欢加空格,逗号这些,他们也通常备用好几条文案,可以将评论库的拿出来对比,这样也可以规避他们换号,换文案的问题。3. 广告词,敏感词,屏蔽词:
广告词、敏感词、屏蔽词库需要有个可编辑的后台,可随时增减,初期先从网上找批词库;
遇到发布包括广告词,敏感词的评论,将广告词,敏感词替换成*;
广告词有如“淘宝店”“二维码”“公众号”等,屏蔽词有如“招聘打字员”或者发广告者的联系方式;
如果评论*超过10个,则机审失败,如果包含屏蔽词,直接机审失败;
其实词库其实根据敏感度不同做一些划分,避免误伤普通用户。另外把广告者的联系方式加到屏蔽词库十分有效。在匹配词库时需要做个字符串范围,比如微asd信,也算作微信。4. 白名单用户,黑名单用户:
白名单用户、黑名单用户需要有个可编辑的后台,可随时增减;
若同一用户一天内机审失败的评论超过10,则自动列入黑名单;
白名单的用户不受发布次数限制,但内容需要检查广告词、敏感词、屏蔽词,如果一天内发布的评论超过10条机审失败,也自动列入黑名单;
列在黑名单的用户发布评论时,弹出toast“您暂时无法发布评论”或机审直接失败;
最后补充下,其实没有对IP进行限制是因为在公共区域的wifi好像IP是一样的,尽管非常希望处理掉垃圾评论这一问题,但我还是希望在不影响到普通用户的前提下。
■网友
这个网上一般不会写,这种职业一般存在于做网络直播或者是社区论坛的公司。审核机制最好的方式就是一评多审,最好是能将问题评论过滤到多个平台操作,采用数据库自动屏蔽和人工审核相结合的模式,往往能事半功倍!
■网友
推荐阅读
- 鸿水|丁真刷屏遭反噬!导演炮轰网友“没见过男人”,评论不忍直视
- 有哪些轻易就被识别的淘宝刷单评论语言
- 如果有一天微博、微信、论坛突然取消所有点赞、评论、转发功能,会发生啥有趣的事
- 百度云盘怎样审核
- 汽车商业评论|一汽-大众ID.4 CROZZ:冠军的梦想与焦虑
- 区块链中merkle树是怎样验证的,它的具体运行机制是
- iOS 应用中推送(Push Notifications)的机制是怎么样的
- 刘德华|贾玲太后悔!连续两人在评论区晒刘德华合影,郎朗很过分
- 山东一大学宿舍大到能打羽毛球!网友评论区太魔性了…哈哈哈哈哈
- 咋把快手评论区的表情包存到自己的手机相册里
