Facebook AI系统误删真新闻,社交巨头面对海量内容该如何审核?
热点追踪/深度探讨/实地探访/商务合作
Facebook又搞砸了 。 像是矫枉过正 , 这一次它删错了帖 。
3月17日 , 许多Facebook用户发现自己从媒体转发关于新冠病毒的文章被删 , 页面显示这些链接违反了社区的垃圾信息规则 。
随着全球范围内新冠病毒疫情越来越严重 , 围绕疫情的假新闻也逐渐变多 , 怎样辨别假新闻并删帖 , 成为社交媒体近期最关注的事 。 但是 , 上面提到被删除的文章都属于正式合法的媒体网站 , 包括TheAtlantic , USAToday , 和BuzzFeed等美国老牌或新兴的媒体 。
也就是说 , Facebook把真新闻当成假新闻删掉了 。

文章图片
疫情期间 , 社交媒体上假新闻越来越多 , 如何辨别成了问题|视觉中国
矛头很快指向了Facebook的人工智能审核系统 。 由于疫情的缘故 , Facebook在3月16日暂停了公司所有审查内容人员的工作 , 内容审核的工作转而交给平台上的「机器人」 。 Facebook声称:「由于可供审查的工作人员越来越少 , 我们将继续优先处理那些迫在眉睫的危害内容 , 并增加对其他领域的主动检测 , 以删除违规内容 。 」
自然而然 , 人们怀疑是人工智能误删了正规新闻 。 但随后Facebook副总裁GuyRosen声明 , 这是反垃圾信息系统中的一个bug , 与公司内容审核团队做出的任何调整无关 。
虽然整件事闹出乌龙 , 但这背后反映的是人们对技术的不信任 。 谷歌最近也警告称 , 视频平台YouTube上以违反内容政策为由的被误删视频可能会大量增加 , 原因是在新冠病毒疫情流行期间 , 该公司将更多地依赖AI来审核视频 , 而不是人工 。
即便在科技大公司口中 , AI一直在进步 , 好像可以承担很多人工的工作 。 但内容审核并不能完全交由AI处理 , 相反 , 近几年的趋势是 , 大公司们纷纷扩大了人工审核的规模 。 为什么人工智能发展了这么多年 , 审核内容这件事反而需要更多人工?在这背后 , 大公司又经历了什么?
内容暴增 , AI担起审核重任
互联网不是法外之地 。 为了解决网络上出现的淫秽色情、暴力血腥等违法内容 , 很多平台会设置内容审查制度 。 有必要提及的是 , 诸如Google、Facebook、Twitter等互联网公司在近几年都大大加强了内容审核的力度 。 究其原因 , 大概可以总结为「流量的变化」 。
一方面 , 平台的用户增长到了一个可怕的量级 , 仅就Facebook来看 , 2019年第四季度 , Facebook的月活达到了25亿 , 这还只是一个app , 不算Facebook旗下的Messenger、Instagram和WhatsApp等应用 。
另一方面 , 这些年内容形式变得越来越复杂 , 从文字 , 到图片 , 再到现在的视频和流媒体 , 互联网上的数据量疯狂增加 , 更多的用户每天都在产出更多的内容 。 随着信息、内容和用户的暴增 , 科技巨头既可能创造了一个新的纪元 , 也可能打开了潘多拉的魔盒 。 这个过程中 , 对于内容的把控就显得格外重要 。
还以Facebook为例 。 过去 , Facebook对内容的管控相对松弛 , 虚假新闻、标题党甚至恐怖主义言论经常出现 , 审核团队人数也意外的少 。 据悉 , 2012年Facebook有8亿多用户的时候 , 审核团队只有50人左右 。

文章图片
人工智能在前几年变成Facebook在内容审核上寄予希望的技术|视觉中国
人工智能兴起之后 , 很多互联网巨头第一时间将技术应用于自身的业务 , 其中就包括Facebook 。 从2017年开始 , Facebook就在尝试使用人工智能解决内容审核的问题 , 当时可以做到使用AI图像识别工具来搜索照片 , 也宣布推出一套能够识别出试图自杀或自残的用户的系统 。
但是 , 当时的人工智能技术并不够成熟 。 比如在理解语境方面 , Facebook的AI系统就不够智能 。 并且 , AI在当时只能作为辅助判断 , 并不能真正进行决策 。 扎克伯格曾在当时的公开信中提到 , 这套系统可以标记疑似内容 , 以便团队再次审核 。
如今 , 人工智能在Facebook的内容审核上有了长足的进步 。 根据FacebookCTO迈克·斯科洛普夫在采访中说到 , Facebook已经能够自动从社交网络上删除96%的裸露内容 。 而仇恨言论问题则比较棘手 , AI系统可以识别出65%包含仇恨言论的帖子 。
对于图片和视频来说 , 人工智能介入审核是非常有效果的 , 因为计算机视觉识别技术相对成熟 。 机器通过一定时间的训练都能够识别出敏感类别的内容 , 比如裸体、比如枪支等等 。 视频同理 , Facebook曾经展示过AI对于图片和视频的识别 , 基本不会出现差错 。

文章图片
Facebook人工智能技术在图像识别上的应用|视觉中国
然而也在人工智能技术高速发展 , 看似能代替人们做更多事的时候 , Facebook做出了一项令人意外的举动:扩大人工审核团队 。
据不完全统计 , 自2017年开始 , Facebook几乎每年都要招揽几千名内容审核员(以外包形式) , 这个数字在2020年增长到了1万余名 。 他们要做的工作听起来也很简单:按照Facebook的用户内容政策 , 对有害内容进行审核和删除 。
到底发生了什么 , 让Facebook对技术「丧失了信心」?
盲点出现
2019年3月15日 , 28岁的布伦顿·塔兰特(BrendonTarrant)持枪冲进新西兰基督城的两座清真寺 , 朝正在参加主麻日的人群射击 , 杀害了50人 。 这则新闻在全球范围内广泛传播 , 因为凶手在FacebookLive上直播了从准备武器到杀人的全部过程 。
行凶过程的直播持续了17分钟才被Facebook删除 , 但17分钟对于一场直播来说已经足够进行大范围的传播 , 更何况还有保存下来的视频在平台上扩散 。 尽管Facebook声明自己「迅速采取了行动删除内容」 , 但有用户称 , 删除视频几小时后仍可以看到这些内容 。
同样的情况在过去两年间发生过数次 , Facebook应对往往不够及时 , 导致恶劣的情况时有发生 。 而这就涉及到了人工智能在图片和视频之外的「盲点」——直播 。

文章图片
直播业务成了Facebook内容审核上的难点之一|视觉中国
和固有的图片视频识别不同 , 直播对审核的要求非常之高 。 除了实时识别画面这一难点之外 , 人们在直播中的一举一动都无法预测 , 这是目前人工和机器都无法做到的事 。 谁也不知道 , 直播者下一秒会在镜头前开枪射击 。
斯科洛普夫也提到 , AI没能将新西兰枪击案直播识别为危险内容 , 因为「它和之前上传到Facebook上的视频都不一样 , 这段视频是以第一人称视角来展现过程 , 就像电脑游戏 。 」
所以在2017年一次直播杀人事件之后 , Facebook增加了3000名人工审核员专门审查暴力直播视频 。 对于巨大的平台来说 , 人工智能技术还远不能完全取代人类 , 甚至连取代一部分都做不到 , 内容审核远比人们想象中的更加困难 。
人工与AI的协作
我们所处的环境是千差万别的 。 全球各个地区的政治文化背景都不相同 , 并且每天都可能有变化存在 , AI还无法处理这么复杂的动态 。
那么 , 同样的逻辑放在人工审核上是否可行?这就要涉及到平台的一套审核标准 。
2018年 , Facebook首次公布了详细的内容审核标准 , 也就是社区守则 。 经过几个版本的调整 , 该标准分为六大板块:暴力和犯罪行为、安全、不良内容、诚信与真实性、尊重知识产权和内容相关申请 , 定义了哪些内容可能会被删除 。
但问题在于 , 不是所有的内容都是非黑即白 , 要让所有审核人员明确标准 , 做出一致的决策 , 本来就是不可能的事 。

文章图片
在内容审核上 , 人工智能技术和人们思考的逻辑并不相同|视觉中国
技术的逻辑和人们思考的逻辑不同 。 说到底 , 深度学习技术只是根据既有的数据进行训练 , 从而展示出的一个个数据模型 , 它和人类的主动思考完全不一样 。 因此 , 如Facebook人工智能副总裁杰罗姆·佩森蒂(JeromePesenti)所说 , 「AI与人类智力的差距非常大 , 它可以传播人类的偏见、不容易解释、不具备常识 , 更多的是停留在模式匹配的层面 , 而不是强大的语义理解」 。 所以 , 如果AI在内容审核的判断上出了偏差 , 没有人敢为其担下责任 。
如上文提到的 , 在理解仇恨言论上 , AI并不能像识别图片和视频那样达到高准确率 。 原因在于内容本身 , 不同的内容表达上含义不一样 , 可能取决于上下文 , 可能只是讽刺但没有到达仇恨言论的高度……因为很难被定义 , 所以AI在审核这方面内容时有局限性 。
总结下来 , 人工智能无法代替人类的问题在于技术在理解语言和行为预测上有一定困难 , 而这些问题即便人工也不能即刻给出答案 。 利用AI将疑似有害内容发送给人工审核进行二次判断 , 无论从安全角度还是成本角度讲 , 都是最优解 。
加州大学洛杉矶分校信息研究教授SarahT.Roberts很早就开始研究社交媒体的内容审核 , 她最近看到的趋势是 , 社交媒体的审核方式已经从人工手动审核进化到了训练机器审核 , 以便人工对机器审核的内容进行决策 。 当然 , 在整套审核过程当中 , 「人」始终没有脱离出这个闭环 。 「我们将会拥有的是『混合动力』 。 」SarahT.Roberts说到 。
内容审核的意义
不仅是Facebook , 在大时代的变化下 , 科技巨头公司掌握了海量的信息和内容 , 一举颠覆了「媒体」的概念 。 这种改变世界的影响 , 是科技公司创始人们刚开始创业的时候无法预料到的 。
然而 , 在改变世界之后 , 留给他们的问题是怎样不滑向「黑暗面」 , 甚至让平台更加光明 , 这也许就是所有巨头投入大量资金和精力做内容审核的意义所在 。
平台的内容管控和商业利益一直是矛盾的关系 , 科技公司要做的就是找到其中的平衡关系 。 放弃短期的商业利益 , 约束自己的边界 , 换取的可能是更大的社会影响力 , 也是科技巨头必须面对的巨大挑战 。
如果把互联网巨头比作一个向前快速滚动的巨轮 , 算法就是其中一个关键零件 , 零件偏了一点方向 , 巨轮的轨迹极有可能发生巨大变化 。 而零件怎么偏 , 偏多少 , 都可以经过掌控者的计算 。
因此 , 大公司们要怎么在引以为豪的「科技」和「商业」标签上加入对社会的影响和价值 , 是比前两者更亟待解答的东西 。 毕竟 , 科技没有善恶 , 善恶来自科技的使用者 。

文章图片
兰博基尼口罩 , 特斯拉呼吸机 , 这些国外企业为何能快速转产抗疫物资?
可自我组装、修复的机器人或梦想成真!变形金刚“汽车人”离我们越来越近?
这个实验室让万人迷卡卡受益匪浅!揭秘职业体育运动背后的黑科技
【Facebook AI系统误删真新闻,社交巨头面对海量内容该如何审核?】苹果谷歌首次联手推出抗疫工具;科学家警告海洋系统可能会在十年内崩溃|科技前沿周报
推荐阅读
- 鸿蒙系统+1.08亿像素主摄华为P50,华为P30跌至白菜价在即
- 湖南安仁通报公职人员吸毒检测结果:交通系统两职工检出阳性
- 鸿蒙OS系统+一亿像素华为Mate40,华为Mate30再创超低价神话
- TN-C系统在农村鱼塘供电中的应用分析与改造实施
- 车载微信好用吗?全新交互体验,2020款哈弗F5 Fun-Life系统尝鲜
- 肺炎美国超161万例,巴西圣保罗州医疗系统已近满负荷
- 黑屏、乱码、重启……知名品牌手机凌晨系统崩了!官方回应了
- 大批三星手机系统一夜崩溃变砖:临时解决办法来了
- 除了电动汽车,博世甚至还为婴儿车使用了电动系统
- PC系统终于有纯国产配件了,光威弈系列Pro内存条测试
