想让文本识别更“智能”,来数据堂获取这些OCR转写数据!( 二 )


四边形框顶点偏差不超过五个像素为正确检测 , 检测框精度不低于95% , 文本转写精度不低于95% , 该数据可用于多国语言OCR任务 。

想让文本识别更“智能”,来数据堂获取这些OCR转写数据!
文章图片

数据涵盖12种语言(6种亚洲语、6种欧洲语) , 包括商店牌匾、站牌、海报、车票、路标、漫画、井盖画、提示语、警示语、包装说明、菜单、建筑物标志等多种自然场景 。
在标注方面 , 标注行级文本的四边形框 , 行级文本转写 , 四边形框顶点偏差不超过五个像素为正确检测 , 检测框精度不低于97% , 文本转写精度不低于97% 。

想让文本识别更“智能”,来数据堂获取这些OCR转写数据!
文章图片

数据包括自然场景图片2,056张 , 互联网图像1,103张 , 文本图像347张 。 在标注方面 , 行级内容用行级四边形框标注、行级内容转写;竖列内容用竖列四边形框标注、竖列内容转写 。 数据可用于多场景下的印地语识别、印地语拍照翻译等任务 。

想让文本识别更“智能”,来数据堂获取这些OCR转写数据!
文章图片

数据包括自然场景图片258张 , 互联网图像2,553张 , 文本图像2,184张 。 在标注方面 , 行级内容用行级四边形框标注、行级内容转写;竖列内容用竖列四边形框标注、竖列内容转写 。 数据可用于多种场景下的越南语识别、越南语拍照翻译等任务 。
相比物体检测识别 , OCR由于包含倾斜文本框、低分辨率文字和文本版面多样化的情况 , 因此OCR数据标注具有特殊性 , 标注成本更高 。
数据堂的数加加Pro标注平台支持私有化部署 , 能够帮助企业快速、安全的对人工智能数据进行标注 , 为企业提供更专业、更安全的数据基础设施 。
免责声明:市场有风险 , 选择需谨慎!此文仅供参考 , 不作买卖依据 。
【想让文本识别更“智能”,来数据堂获取这些OCR转写数据!】责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com


推荐阅读