腾讯研究院关于“深度合成”技术的十个误解
本文插图
作者 | 曹建峰 腾讯研究院高级研究员
随着人工智能时代的到来 , 下一代媒体将由人工智能驱动 , 人工智能可能给数字内容领域带来重塑 。 其中 , 可以实现换脸、人脸合成、语音合成、视频生成甚至数字虚拟人等诸多应用形式的“深度合成”技术 , 作为人工智能发展到一定阶段的产物 , 逐步从deepfake、deepnude等色情性的换脸视频的阴影中走了出来 , 迎来了商业化时代 。 AI虚拟主播、电商平台上的“数字试穿”、电影后期制作、社交产品中的人脸融合、合成人脸和合成虚拟形象用于在线营销、合成声音用于失声患者发声 , 以及数字虚拟人等创新性的应用持续涌现 , “深度合成”技术的社会福祉日益彰显 。 但由于对技术的不了解 , 人们对“深度合成”技术还存在诸多偏见和误解 , 例如认为“深度合成”就是“深度伪造” , 认为“深度合成”会彻底冲击社会信任 , 等等 。 为此 , 腾讯研究院、腾讯优图实验室共同完成报告《AI生成内容发展报告2020——“深度合成”(deep synthesis)商业化元年》 , 并基于该报告总结出了人们对该技术的十个误解 , 希望通过澄清这些误解 , 帮助人们更全面地了解深度合成技术的发展和应用情况 。
误解1:深度合成技术仅包括AI换脸一种形式 。
实际上 , 现阶段的深度合成技术 , 除了广为人知的“AI换脸”以外 , 还包括人脸再现、人脸生成、语音合成等技术 , 并朝着全身合成、数字虚拟人等方向发展 。 AI换脸是最早进入公众视野 , 也是目前应用较多的深度合成形式 , 可以借助人工智能技术对视频中的人脸进行替换 , 在一些AI换脸应用中 , 用户只需上传一张面部照片 , 就可实现化身电影中的演员、游戏中的角色等效果 。 除此之外 , “人脸再现”涉及对目标人物的脸部表情进行驱动;“人脸合成”涉及创建媲美真实人脸的全新人脸图像;“语音合成”涉及创建特定的声音模型 , 可以将文字转化成接近真人语调和节奏的声音 。 同时 , 深度合成正从局部合成转向全身合成 , 从二维合成转向3D合成;前者例如对目标人物的全身动作进行操控 , 后者则以数字虚拟人技术为代表 。 目前 , 国内外互联网公司纷纷试水数字虚拟人技术 , 例如 , 2018年腾讯携手Epic等企业启动“Siren”虚拟人项目 , 2019年腾讯AI Lab正式发布首个电竞虚拟人“T.E.G”(天鹅静) , 整合3D人脸和人体重建、文本/语音/口型驱动和神经网络渲染等技术 , 特别是利用生成对抗网络完成人体动作的迁移 。 随着5G时代的到来 , 这种捕捉和渲染将会更加灵敏生动 , 数字虚拟人在游戏、社交、影视、医疗等领域将大有可为 。
误解2:任何人都可以制作高质量、高仿真的深度合成内容 。
深度合成内容的制作门槛已大为降低 , 但是高质量、高仿真的深度合成内容的制作还未普遍实现 , 仍需专业技能和专业工具 。 相比于PS等传统的图像处理软件 , 得益于源代码的开放和易用性工具的开发 , 深度合成技术的使用门槛已大为降低 , 普通用户在智能手机、电脑等终端设备上 , 借助深度合成应用程序 , 即可轻易制作、获取AI换脸、人脸合成、语音合成等娱乐性的深度合成内容 。 这类合成内容往往较为容易辨别 , 且存在来源标记 , 不至以假乱真 。 因此就目前而言 , 虽然像FakeApp、ZAO这样的软件已经开始让更多的人接触到深度合成技术 , 但高质量、高仿真的深度合成内容仍然难以创建 , 需要掌握专业技能和专业工具的专业人员的大量投入 。
误解3:深度合成技术已被大量滥用 , 用于在社交媒体平台上制作、传播虚假信息 。
实际上 , 无论是在国内还是在国外 , 社交媒体平台上涉及政治和政治人物的深度合成视频都是很少见的 , 深度合成性质的虚假信息也很少 。 此前在国内外引发广泛关注的奥巴马、普京等政治人物的深度合成视频 , 更多是警示性的和教育性的 , 意在表明深度合成技术可能出现此类滥用 , 而非为了传播政治谣言和虚假信息 。 而且主流社交平台已采取了针对深度合成内容的审核政策 , 因此深度合成内容并未在社交媒体平台中失控 , 也并未给公众话语权与社会舆论造成扭曲 。 但色情性的深度合成视频 , 是深度合成技术滥用的重灾区 , 应予以重视 , 报告显示 , 2019年12月全网共有14678个深度合成视频 , 其中96%属于色情性的深度合成视频 , 主要存在于色情网站 。
推荐阅读
- 腾讯新闻深网|小米引入新高管,任命杨柘出任中国区CMO
- 区块腾讯安全领御TUSI区块链落地五大场景,助力可信城市建设
- |你的微信被监听了?腾讯微信团队辟谣:绝不会做
- 金融投资报社|网易云音乐王者归来,腾讯音乐危机重重,音乐平台“二战”在即?
- 国货腾讯携手吴晓波推出中国首部大型品牌经济纪录片《新国货》
- 腾讯科技|vivo发布X50系列手机:微云台结构量产 三机型3498元起售
- 腾讯科技|一文读懂网易招股书亮点:发售价不高于126港元 研发人员超1万名
- 腾讯大学|《科技向善》出版,马化腾序言再谈使命愿景
- 腾讯科技|社交游戏公司Zynga同意斥资18亿美元收购移动游戏公司Peak
- 3DMGAME|腾讯公布AI“艾灵”:拥有近乎真人声线 还会唱歌跳舞