迭代前端智能化：视觉稿图像识别技术难点和思考 |版面|元素|

Imgcook 中的图片生成代码服务，能够将图片转换成 Flutter、H5 等代码，能够获取元素的位置和属性等内容，具体如下图所示。

本文插图

图片生成代码怎么做
图片生成代码，具体步骤可以分为如下几步：版面分析：提取轮廓和元素属性提取：获取文字、图片、轮廓等的属性布局推导：获取重复布局、GridView、ListView等布局类型代码生成：代码翻译生成对应的Flutter、H5等代码复制代码
本文会介绍版面分析模块的一些难点和思考。

本文插图

技术难点和思考
迭代1：传统图像处理
第一版我们自然想到了先利用机器视觉的方法来做边缘检测和行列投影的方式去获取对应的轮廓和元素。

本文插图

但是这一版本存在很明显的问题：
1）前后景颜色接近会导致无法召回
2）元素叠加时会丢失叠加的元素
例如下图的播放按钮

本文插图

迭代2：引入深度学习
第一版存在不理解语义的问题，我们在第二版引入深度学习去尝试理解语义。深度学习，故名思义存在很深的网络，每一层的卷积网络都能获取不同的特征图，多层融合可以很好地提取特征信息，使得机器“理解”语义信息。

本文插图

迭代3：深度学习融合传统图像处理算法
目标检测方法，无论是一阶段还是二阶段的模式都存在位置定位不准的问题，如下图所示。我们尝试将迭代1和迭代2的方法融合，结合深度学习的语义理解能力和传统图像处理精度高的优点，迭代了第三个版本

本文插图

分析结果
版面分析结合深度学习的语义理解能力和传统图像处理精度高的优点，可以得到很高的精确率和召回率，闲鱼千余张版面分析结果如下：

本文插图
【迭代前端智能化：视觉稿图像识别技术难点和思考】

迭代前端智能化：视觉稿图像识别技术难点和思考

推荐阅读

「金星」金星实力太强很抢手，任嘉伦感觉最尴尬，选手选导师感觉像被安排

曾宝仪|曾宝仪，欧豪，龚俊，张小斐

抢票APP的潜规则到底该如何正确的抢到回家的票

浅表性胃窦炎

特斯拉|宣称能跑480实际跑378公里特斯拉被起诉退一赔三！车主败诉

电视柜上面放什么花好看电视柜上面放什么花比较好

涵雪崂山红茶多少钱,崂山红茶和绿茶哪个好

直播港澳台|为何一些港人会支持特朗普？一厢情愿的幻想背后是什么？

伊朗|若美日联手，中国能应对它们的打击吗？看美国上将怎么说

梧桐|梦幻西游：160封印+流云项链26万成交，150无级别女衣52万被瞬秒

“BOE（京东方）创新日”走进蔚来汽车解锁智慧出行新体验

荣耀MagicBook|首销优惠200元荣耀MagicBook 14/15、Pro锐龙版售价一览：到手3799元起

未来五年如何发展？这些头部城市使用了这样的关键词

车家号|为何有那么多好车，叫好却不叫座？，中国自主品牌

张一山|预感会扑街!张一山方回应演技争议张一山:我也有演不好的时候

黄晓明|谍战剧《潜伏者》将播，万茜蒋欣两大女神主演，黄晓明演男主

中国新闻网|广东新增境外输入确诊病例3例和无症状感染者8例

潇湘大视野|所有受害者接受病毒检测，有阳性！印度客机事故2人新冠检测阳性

NVIDIA|NVIDIA最强光追演示Marbles开放下载：RTX 3080/3090来战

『读历史』南宋为何没被金国灭了？“中兴四将”战斗力有多强悍？，岳飞死后