机器之心屏下摄像头效果不好？微软：上神经网络，还原更真实的可视会议效果( 二 )

本文插图
在计算机视觉这个热门方向里， U-Net 是比较有名的方法。通过深度学习算法，我们获得了与原始图像几乎一致的重建图像：
直接拍摄：

本文插图
屏下摄像头处理前：

本文插图
深度学习算法处理后：

本文插图
通过将相机固定在显示器中，并保持良好的图像质量，我们为长期存在的视角问题找到了有效的解决方案。
对话的位置安排
在对话过程中，空间因素也非常重要，但在目前的视频会议系统中往往是被忽略。参与者们彼此相对的距离是非语言交流中非常重要的方面。
微软认为，通过调整人物图像在显示其中的大小，我们可以很大程度上模拟出说话人位置在虚拟环境中的效果。
图像分割
要想这样做，首先要找到人，微软设计了卷积神经网络（CNN）结构来在图像中定位说话的人。

本文插图
用于分割说话者和背景的神经网络结构。
首先，需要做语义分割以识别并定位图像中的人类。

本文插图
接下来，我们进行深度分割以找到最接近的人类，指认他 / 她为说话者。这种相对简单的技术在单个发言人时工作效果很好，如果存在多个发言人，则需要应用更为复杂的方法。
校正距离
在远程视图中确定了说话者之后，我们就可以缩放传入的视频，以便将远程会议参与者以更为合适的尺寸显示在本地屏幕上。

本文插图
一种实现的方法是缩放整个画面，再把人物定位于正中。但在微软的项目中，研究人员尝试了效果更明显的方法：让人物独立于背景进行调整。
将人物与背景分割调整可以带来一些好处，比如隔离掉不希望显示的背景画面，用背景区域直接显示 PPT 或视频等。
经过取景效果的提升以及人物位置的缩放，我们最终获得的远程会议效果距离真实情况前进了一大步。

机器之心屏下摄像头效果不好？微软：上神经网络，还原更真实的可视会议效果( 二 )

推荐阅读

教你如何化解易“犯小人”！

邮储银行|邮储银行大连分行加强新冠病毒疫苗接种工作

科技财实验 30安培旗舰卡跑分首曝！31％的提升何等酸爽，RTX

中国青年报|“硅”上教学，能否提速芯片人才培养

作品展@“不太一样”的花世界，荒木经惟·花幽摄影作品展开幕

生活、接触的环境和读书的多少，是不是就是决定了一个人的思想高度

检测|印度首都第二轮新冠抗体检测，超四分之一被测者结果阳性

3DMGAME|暴走机车回归，话题新番《天晴烂漫！》确定7月3日复播

大馄饨怎么包大馄饨怎么包的手法视频

引领先锋|好音乐安静听，畅享自由时光，HAKII TIME耳机体验

王思聪|王思聪现身三亚，身边美女如云，住奢华酒店，迎来35岁“大寿”

李洛书黎初瑶第一次与晨同光黎初瑶喜欢李洛书吗

纹身痛吗第一次纹身痛吗

今日必看|V领上衣穿成露肩款，瘦身成功气质越来越好，张靓颖衣品真不错

『成都商报红星新闻』北京输入病例登机前用药退烧被立案

为啥现在很少有漂亮女生坐硬座?

G时尚|美貌营业，杨幂今日一身黑白玫瑰礼裙出席活动

看上一辆小汽车：门下会有一滩水掉落，这是通病，雨天打开23万大众CC的车门

|银圆上有“撮记”，还有收藏价值吗？

人民日报客户端|空客披露今年上半年民用飞机交付196架