开发者 开发者福音!百度大脑EasyData提升数据管理全流程效率( 二 )


开发者 开发者福音!百度大脑EasyData提升数据管理全流程效率
文章图片
开发者 开发者福音!百度大脑EasyData提升数据管理全流程效率
文章图片
开发者 开发者福音!百度大脑EasyData提升数据管理全流程效率
文章图片
为了进一步方便用户使用,目前已经支持同时接入多台摄像头设备。在对摄像头进行云端管理时,用户可以查看每一台摄像头的在线/离线状态,确保摄像头在线以保证数据的上传。并且,通过筛选条件,用户可以查看单个或多个摄像头采集上传的数据。
开发者 开发者福音!百度大脑EasyData提升数据管理全流程效率
文章图片
EasyData也支持数据闭环模型优化策略,通过云服务调用获取数据,由于EasyData已经实现了与EasyDL的数据共享,这里的云服务指的是用户在EasyDL平台将模型发布为公有云API后,在授权EasyData获取API调用数据的前提下,用户可以通过EasyData查找公有云API中识别错误的数据,保存到数据集进行清洗、标注后,进行下一次模型优化训练,最终提升EasyDL公有云API调用的模型效果。
整个流程,如下图所示:
开发者 开发者福音!百度大脑EasyData提升数据管理全流程效率
文章图片
【多种标注方式省时省力】
在数据标注方面,EasyData不仅支持多类数据、多种模板的人工标注,还支持智能标注。只需用户进行少量关键数据的操作(通常为完成30%左右的数据标注),即可一键化完成剩余数据的处理,在多轮标注之后,可以保证模型训练效果的持平,大大降低了数据标注的成本。目前智能标注已支持物体检测、图像分割、文本分类。
在多人协同标注方面,EasyData可以和百度众测进行对接,未来还将推出全新的多人标注,让用户在平台直接进行标注任务的管理、分发和验收,更为便捷地完成协同操作,在短时间内完成对大量数据的处理。
【智能清洗快速提升数据质量】
在影响模型效果的诸多因素中,数据质量始终是一个关键问题。尤其在众多使用EasyDL进行CV方向模型开发的用户中,图片的清晰程度、被检测物体的具体位置都会对模型的最终表现产生影响。
数据清洗是很多用户期待已久的功能。EasyData不负众望,为用户提供了这一服务。在图像方向,EasyData为用户带来了去模糊、去近似、旋转、镜像和裁剪等清洗和处理功能。其中,去模糊、去近似、裁剪等功能非常试用于视频数据抽帧后的原始图片数据处理,适用于视频监控等业务场景应用获取高质量数据。
去模糊:在使用去模糊功能时,可以在图片上方看到一个清晰度调整条,通过拖拽圆点选取对应清晰度取值,将会仅保留清晰度高于此值的图片。以下图为例,当我们选择“保留清晰度大于等于此值的图片:4959”时,仅有最右侧清晰度为5000的图片被保留下来。
开发者 开发者福音!百度大脑EasyData提升数据管理全流程效率
文章图片
去近似:与去模糊相似,用户可以在图片上方看到一个近似度选取条,通过拖拽圆点选取对应相似度取值,只会保存相似度高于此值的图片。以下图为例,当用户选择“两图相似度大于等于此值保留一张:0.57”时,仅有相似度为0.75的第一张图将会被保留下来。
开发者 开发者福音!百度大脑EasyData提升数据管理全流程效率
文章图片
旋转:根据示例中参考图片,通过下拉框可以选择不同的顺时针旋转角度,最终针对所有图片做旋转操作。
开发者 开发者福音!百度大脑EasyData提升数据管理全流程效率
文章图片
镜像:水平镜像是指将图像的左右部分以图像垂直中轴线为中心进行镜像对换;垂直镜像是指将图像的上下两部分以图像水平中轴线为中心进行镜像对换;中心镜像是指将图像以图像水平中轴线和垂直中轴线的交点为中心进行镜像对换,相当于将图像先后进行水平镜像、垂直镜像。根据示例中参考图片,通过下拉框选择不同的镜像方式,最终针对所有图片做对应镜像操作。


推荐阅读