100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活

十三发自凹非寺量子位报道|公众号QbitAI
百年前的北京是什么样子?
最近 , 一位叫大谷Spitzer的微博网友 , 便利用AI技术 , 将人民日报4年前发布的1920年北京黑白影像资料 , 做了修复工作:完成了上色、修复帧率、扩大分辨率等步骤 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
如此工作满足了大批网友的好奇心 , 视频一经发布便得到了大量的关注:分享超过12万次、评论3万+、点赞5万+ 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
有网友评论到:
视频里人怎么也想象不到 , 一百年后会有一个人躺在床上拿着一个神奇的物品能够观察到他们当时的一举一动吧 。 科学和巫术果然就是一线之隔 。
还有网友赞叹道:
Wow~一百年前的vlog 。
不是概念的 , 宏观的 , 文字的 , 被描述的 , 被审视的 。 完全打破我的模糊想象 , 被触动了 。
当然 , 还有感慨二环不堵了的……
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
话不多说 , 一起来体验下吧 。
时光旅行 , 体验100年前的北京生活
1920年的北京 , 入城出城的“客流”还算较多 , 有骑马的、有坐轿子的、有坐人力车的 , 当然多数人还是步行 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
而在城内集市中 , 也是熙熙攘攘 , 好不热闹 。 当然 , 在那个年代 , 人们应该是对录影设备感到非常新奇了 , 图中的小哥驻足了良久 , 痴痴的看着镜头 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
路边街头的小吃生意也是不错(看完想来一屉小笼包了……) 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
寺庙里烧香拜佛的人们络绎不绝 , 当时的香火可比现在要鼎盛啊 。
但细心的网友也发现:除了寺庙 , 在大街上很少看见女人 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
再来到巷子里的百姓生活:小孩买了吃的蹲坐在别人家门口 , 然后被赶走了……
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
还有熟人见面鞠躬打招呼的场景 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
可以看到男女打招呼的方式还是有些区别 。 网友对此还调侃道:萝卜蹲?
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
还有网友表示:真是百年巨变 , 没想到一百年前这么懂礼节 。
当然 , 还有网友表示:100年了 , 狗狗长得还是一样的……
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
最后 , 让我们一起来俯瞰百年前的北京城 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
AI修复百年古董老电影
虽然博主大谷Spitzer没有介绍具体采用了哪些AI技术 , 但其实修复老电影的工作也有许多 。
今年2月 , 我们报道了国外网友DenisShiryaev利用一种增强程序(GigapixelAI) , 将1896年的古董电影《火车进站》 , 转变成了4K60fps高清“大电影” 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
在修复帧率方面 , 主要采用的技术是AI插值 。
据Shiryaev介绍 , 他采用的是一种叫做GigapixelAI的商业图像编辑软件(付费) 。 这款软件由Topaz实验室创造 , 可以让图像的质量提升600% 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
它利用一种专有的插值算法 , 对图像做分析、识别其细节和结构 , 最后将额外的“信息”填充到图像中 。
这个工作量是什么概念?
普通的高清是1920×1080 , 总像素为2073600 , 而4K高清是3840x2160 , 总像素是8294400 。
也就是说 , 光是要把普通高清提升到4K高清 , 就需要额外填充600万个像素 。
不仅如此 , 还需要弄清楚如何显示这些额外的像素 , 这就是插值过程的用武之地 。
插值估计每个新像素要显示什么内容 , 这个过程是基于它们周边的像素 。 对于这一点 , 有许多方法可以来衡量 。
最近邻(NearestNeighbor)方法 , 会简单地用与其最近邻相同的颜色填充空白像素 。 它虽然简单而有效 , 但结果是一个锯齿状、明显像素化的图像 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
双线性插值(BilinearInterpolation)方法需要更多的处理能力 , 但它基于最近的两个像素来分析空白像素 , 并在它们之间生成一个梯度 , 这会让图像变得更加清晰 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
而双三次插值(BicubicInterpolation)会对其16个最近邻像素进行了采样 , 这样就会让着色变得精确 , 但仍然存在图像模糊的问题 。
100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活
文章图片
通过结合双线性插值和双三次插值 , 就可以生成光学质量损失最小的放大图像 。
而这一过程 , GigapixelAI利用深度卷积神经网络来完成 。
解决了像素低的问题 , 还需要解决视频卡顿问题 。
GigapixelAI在关键帧之间进行“想像”之后 , 把这些想像出来的帧插进去 。
而它插入的帧数多到可以让视频速率提高到60FPS 。
这就是古董电影也能变得如此清晰、流畅的原因 。
至于着色工作 , 同样是利用神经网络 , 从一堆彩色照片开始 , 将它们转换成黑色和白色 , 然后再重建彩色原图 。
奉上完整视频 , 你想穿越吗?
最后 , 我们奉上大谷Spitzer的完整视频 , 里面还在各个场景中配上了背景音乐 。
如此的场景 , 令不少网友想起老舍先生《想北平》中的一段话:
我所爱的北平不是枝枝节节的一些什么 , 而是整个儿与我的心灵相黏合的一段历史 , 一大块地方 , 多少风景名胜 , 从雨后什刹海的蜻蜓一直到我梦里的玉泉山的塔影 , 都积凑到一块 , 每一小的事件中有个我 , 我的每一思念中有个北平 , 这只有说不出而已 。
那么 , 在看到百年前栩栩如生的生活状态 , 你会有想穿越回去的冲动吗?
快来评论区写下你的感受吧~
参考链接:
https://weibo.com/2395607675/J0ZsQnP6a?filter=hot&root_comment_id=4502616270201172&type=comment
https://arstechnica.com/science/2020/02/someone-used-neural-networks-to-upscale-a-famous-1896-video-to-4k-quality/
—完—
量子位QbitAI·头条号签约
【100年前的北京Vlog火了!AI修复古董纪录片,还原1920年京城生活】关注我们 , 第一时间获知前沿科技动态


    推荐阅读