10亿张人脸数据被抓取我们正面被偷脸
阴影下的人脸识别产业:被低估的风险本刊采访人员/杨智杰发于2020.11.16总第972期《中国新闻周刊》清华大学法学院教授劳东燕的抗争 , 赢得了一次小小的胜利 。今年3月 , 劳东燕在小区单元楼电梯口意外看到一张公告:小区即将在每个单元楼门口安装人脸识别门禁系统 , 下方附了一个二维码 , 要求业主自行扫码登记 , 上传人脸、身份证和房产证等信息 。 出于职业本能 , 在人脸识别过度应用上 , 劳东燕一直是坚定的反对者 。 她给物业和居委会写法律函、邮寄过去 , 提醒对方 , 不经同意而收集个人的生物信息 , 违反现行的法律规定 。 在和街道、业委会与物业开展了四方“谈判”后 , 该小区推行人脸识别门禁的计划无限延期 , 至今尚未开启 。不仅是劳东燕 , 越来越多的知名高校法学院教授站出来说不 。 “北大法学院的一位教授 , 他写过关于人脸识别的文章 , 有小区的业主拿着他的文章给物业公司看 , 随后物业搁置了人脸识别系统的安装 。 我有一位同门师兄 , 也是刑法专业的老师 , 在大学园区提出安装人脸识别系统时 , 他追问是哪个部门要求收集 , 能否拿出相应的法律依据?后来 , 安装的事情就不了了之了 。 ”劳东燕写道 。法学教授们的担心 , 正在逐渐成为现实 。 以人脸信息交易为核心的黑色产业链 , 不仅存在 , 而且非常猖獗 。 近日 , 央视新闻报道 , 在某些网络交易平台上 , 花2元就能买到上千张人脸照片 , 照片主人可能会遭遇精准诈骗、财产损失 , 甚至人脸可能被用于洗钱、涉黑等违法犯罪活动 。 “你面前的人脸识别机 , 只要扫一下你的脸 , 比你更清楚你的银行卡余额” 。 人脸数据 , 如果被泄露并与其他数据关联 , 将带来灾难性的后果 。“人脸识别的风险超出你所想 。 ”劳东燕告诉《中国新闻周刊》 , “你不知道是谁在收集人脸 , 不知道到底收集了你哪些信息 , 也不知道对方保存了什么 , 更不知道对方怎么使用 。 后面全部都是黑箱 。 ”“人脸”被偷了“3万张人脸库、15万条记录 , 嵌入行业的深度学习算法为核心 , 人脸识别准确率99.97%、识别速度从技术上来看 , 采集人脸信息很简单 , 只要有摄像头就可以不间断采集 。 很多人都有这种感受 , 收集并使用人脸数据的工具和场景 , 正变得越来越多:拥有相册读取权限的App、提供人脸解锁功能的手机厂商、进行身份验证和面部检测的各种金融类App , 甚至是办公楼里的刷脸出入系统 , 以及无处不在的安防摄像头 。除了少数获得用户同意的软件或场景 , 大量场景下的人脸信息采集 , 悄无声息 。 “部分商城会运用人脸识别技术 , 收集顾客的行为和购买手段”“一些高校运用人脸识别技术收集学生的抬头率、微表情、上课的姿态” , 以及“基于人脸图像分析的换脸、美妆、性格判断、健康状态预测等应用” 。 南方都市报人工智能伦理课题组和App专项治理工作组发布的《人脸识别应用公众调研报告(2020)》(以下简称《报告》) , 列举的上述场景中 , 这些“静悄悄”收集的方式 , 被多数受访者难以接受 。
3月31日 , 安徽合肥市红星路小学(国际部)的教师通过智慧校园人脸识别闸机系统进入校园 。 图/中新“从数据收集环节来看 , 人脸识别具有无意识性与非接触性 , 可以远距离发挥作用 , 并能长时间大规模地积累数据而不被用户察觉 , 具有很强的侵入性 。 ”劳东燕撰文分析 。数据采集是人脸识别产业的最前端 , 因为人脸识别的准确度 , 需要靠大量的人脸数据来“投喂” 。 多位技术人员告诉《中国新闻周刊》 , 技术发展早期 , 数据主要来自于机构或者高校实验室的公开数据集 , 公司找志愿者有偿采集也是重要途径 。云从科技相关负责人告诉《中国新闻周刊》 , 云从科技为此构建了一个由91个摄像头组成的矩阵用于全方位采集人脸 , 2年时间采集了1000个人 , 每个人产生了20万张图片 , 共计2亿张图片 。 采集的人脸数据场景也非常丰富 , 包括不同表情和服饰 , 比如闭眼、皱眉、微笑、大笑、戴眼镜、戴帽子等等 。 另外还会搜集不同光线环境下的数据 , 例如逆光、背光、阴阳脸等 。但线下采集的数据远远不够 , 云从科技还从网络抓取了1000万人大概10亿张人脸数据 , 加入到机器学习的数据库中 。 基于这些海量的数据 , 公司人脸识别准确率从68%上升到99% 。使用爬虫工具抓取互联网上公开的照片 , 成为整个行业的普遍做法 。 中科院计算所研究员山世光研究计算机视觉和机器学习 , 也是人脸识别公司中科视拓的创始人之一 。 他曾告诉《中国新闻周刊》 , 人们在网站上传照片 , 如果能找到两三张或者十几张照片 , 这个人的数据就可以用来给算法做能力建设 。 这些数据包括一些明星、体育运动员、政治人物的照片 , 也包含普通人的照片 , 数量庞大 。黄昊(化名)曾在微软研究院工作 , 他告诉《中国新闻周刊》 , 现在人脸识别模型最需要质量较差的数据 , 比如大角度的照片、光照不好的照片、年龄跨度较大的照片等 。 这些公司很少再爬取社交网站上摆拍的、质量较高的照片 , 而是直接在生活场景中主动放置摄像头拍摄和识别 , 这种无配合的数据效果最佳 。多位人脸识别从业人员都提到 , 在人脸识别技术上 , 中国之所以走在世界前列 , 一定程度上得益于互联网上的大量数据以及相对宽松的网络环境 。 在他们看来 , 互联网上的照片是“主动公开的” , 拿这些数据锻炼算法“不算侵犯隐私” , 公司并不会获取除人脸外的其他个人信息 。中国科学院自动化所研究员、北京智源人工智能研究院AI伦理中心主任、国家新一代人工智能治理专委会委员曾毅认为 , 这种爬虫的做法并不合理合法 , “我甚至难以相信 , 技术公司只是单纯采集照片 , 不拿走网站上其他的个人信息 。 ”他解释 , 在网上抓取的数据需要先整理和标注 , 再提供给算法训练 。 标注中 , 一张图可以有许多分类 , 比如女性、成年人、亚洲人等 。 曾毅指出 , 社交网站上有一些数据信息 , 比如生日、毕业院校、职业等 , 都可以赋予照片解释 , 用来帮助数据标注 。这种做法在国外也引发了争议 。 澳大利亚摄影师Georg Holzer是Flickr(图片分享网站)的用户 , 他喜欢把照片发布在网站 , 并同意将照片免费共享给非营利组织和艺术家 。 但是 , 让他意外和反感的是 , 巨头公司IBM在未经他同意的情况下 , 拿走了他拍摄的照片 , 也包括网站上其他数百万张照片 , 用以锻炼人脸识别技术的准确度 。这是NBC(美国国家广播公司)的一则报道 , 指出了人脸识别行业的潜规则:IBM以及数十家研究机构免费采集网上的公开照片 , 用以锻炼算法 , 而照片中的人和摄影师并不知情 , 想要删除自己的照片 , 更是几乎不可能 。今年1月 , 美国一家面部识别软件公司Clearview AI遭遇行业声讨 。 该公司发明了一款人脸识别的应用程序 , 使用者只需上传一个人的照片 , 就能搜索出这个人在网络上的公开照片以及网页链接 。 更让人惊恐的是 , 这个系统可以识别此人的名字、住址 , 曾经做过什么事情 , 以及人际关系网 。系统背后 , 有一个超过30亿张图片组成的数据库 。 Clearview AI称 , 这些图片是从Facebook、YouTube、Twitter、Instagram以及其他数百万个网站上搜集而来 。 此前1年 , 已经有600多家执法机构使用了Clearview的软件 。 由于牵扯隐私等问题 , Clearview AI公司遭到抵制 。 新泽西州颁布州禁令 , 禁止执法机构使用 Clearview AI 的应用工具服务 。 Twitter、Google、YouTube、Facebook 等互联网公司也对其进行封杀 。“人脸”被卖了今年9月 , 李开复在一场峰会的言论 , 触碰到了行业的敏感神经 。 李开复称 , 早期他曾帮助旷视寻找到了美图、蚂蚁金服等合作伙伴 , 让旷视拿到了大量的人脸数据 , 帮助分析各个行业怎么切入 。蚂蚁金服迅速做出回应 , 称“从未提供任何人脸数据给旷视科技” , 双方过往合作仅限旷视科技授权其图像识别算法能力给蚂蚁单独部署和使用 , 不涉及任何数据的共享和传输 。 旷视也紧接着在微博澄清 , 公司不掌握 , 也不会主动收集终端用户的任何个人信息 , 旷视高度重视“数据隐私安全保护”问题 , 已在企业内部制定、实施了完善的数据隐私保护制度 。 当晚 , 李开复为此事道歉 , 称这只是一次口误 。旷视科技成立于2011年 , 起家于人脸识别 , 在计算机视觉领域与商汤科技、依图科技、云从科技并称CV(计算机视觉)四小龙 。 这些AI创业公司 , 位于人脸识别产业的中游 。 同样在这个赛道与之竞争的还有微软、BAT、Google等大型互联网公司 , 坐拥海量数据 。 人脸识别创业公司对这些数据 , 也具有强烈的渴望 。AI技术公司如何与客户合作 , 人脸数据被谁拿走、如何存储 , 受到公众大量关注 , 但从来都不透明 。 旷视科技《Face++人工智能开放平台开发者服务协议》中就曾指出 , 旷视有权保存用户的数据并用于旷视及其关联公司内部研究的目的 , “主要用来提升人脸识别的准确率、算法升级和改善我们的产品和服务等” 。
推荐阅读
- 时光网Mtime|单周大盘仅3.6亿,《金刚川》近10亿
- 特朗普为何不认输?至少15个官司 10亿美元债务等他
- 小区人脸识别,隐患大于必要
- 高速公路|中国“最拥堵最赚钱”的高速公路,耗资110亿,累积收入高达600亿
- 2元买上千人脸数据,你的隐私养活了多少人?
- 千亿国企爆雷:账上400多亿 结果10亿都还不起
- 人脸识别进小区,住户要有说“不”的权利
- 人脸识别|不一般的盛会 不止步的开放——写在第三届中国国际进口博览会闭幕之际
- 担忧人脸识别技术有照片泄露风险 如何应对?
- 胖卡丘|别让赞助商寒心!李宁为CBA豪掷10亿,为何依旧得不到尊重?