科技资讯眺望|三篇论文，纵览深度学习在表格识别中的最新应用( 四 ) 机器之心分析师网络作者：仵冀颖编辑：

图 3. 源数据格式的直观示例
图 4. 基本图结构
图 5 给出了基于图的卷积网络 GFTE 的结构。首先将绝对位置转换为相对位置，然后用这些位置来生成图。同时，将纯文本嵌入到预先定义的特征空间中，然后使用 LSTM 来获取语义特征。将位置特征和文本特征连接在一起，并将它们传送到一个两层图卷积网络（GCN）。同时，作者使用了一个小内核算子对图像进行膨胀，使表格的线条更粗。还将图像调整为 256x256 像素，以便使输入的图片正常化，然后利用三层 CNN 计算图像特征。最后，利用节点的相对位置，计算出流场网格。利用网格中输入的像素位置计算输出，可以得到某个节点在某一点上的图像特征。这三种不同的特征都得到后，将生成的图的一条边上的两个节点配对，即，找到一条边上的两个节点，并将它们的三种不同的特征集合在一起。最后，使用 MLP 来预测两个节点是在同一行还是在同一列中。
图 5. 基于 GCN 的 GFTE 算法的结构
4、实验结果介绍
首先，作者对比了不同 GFTE 模型的效果。第一步，对 GFTE-pos 进行训练，即利用相对位置和 KNN 算法生成图，只利用位置特征训练 GFTE 。第二步，利用 LSTM 获取的位置特征和文本特征对网络进行训练，该模型标记为 GFTE pos+text 。最后，在网格采样的基础上，进一步加入图像特征，训练得到本文提出的 GFTE 。表 4 给出了不同 GFTE 模型在 FinTab 数据集上的性能。当引入更多种类的特征时，准确度总体呈上升趋势。当加入文本特征时，准确度有明显的改善，即水平预测和垂直预测分别提高了 10% 和 5% 。进一步加入图像特征仍能继续提高性能，但提高的程度不会太大。
表 4. 不同 GFTE 模型在垂直和水平方向上的准确度结果
表 5 给出了 GFTE 在不同数据集上的准确度结果，即，在 SciTSR 测试数据集上进行验证，在本文提出的 FinTab 数据集上进行测试。可以观察到，本文提出的 GFTE 算法在 SciTSR 验证数据集上达到了相当高的准确度，这意味着 GFTE 在训练数据足够的情况下能够很好地作为基线方法。另外，虽然 FinTab 数据集的数据源和属性与 SciTSR 数据集完全不同，但 GFTE 仍然取得了良好的结果，这表明 GFTE 具有一定的鲁棒性。
表 5. 验证数据集和测试数据集垂直和水平关系的准确度结果
5、小结
本文基于 PDF 文件构建了一个中文金融表格数据集 FinTab ，该数据集具有多样性、充分性和全面性等特征。基于 FinTab ，后续可以研究并提出更多具有创新性、性能更优的表格识别算法，从而辅助金融类、中文表格识别任务。此外，作者提出了一种基于 GCN 的 GFTE 算法作为该数据集的基线表格识别方法。本文对该基线方法的性能、可能存在的问题进行了分析，为后续的工作打下了基础。

科技资讯眺望|三篇论文，纵览深度学习在表格识别中的最新应用( 四 )

推荐阅读

南京警方通报大学生“偷外卖”事件:有工作，偷外卖系报复行为

网络游戏|魔兽世界怀旧服NAXX成神的职业，暴雪设计师算是照顾了一回！

中新经纬|佐力药业：4名董监高拟减持不超2.03%股份

哈利波特|《霍格沃兹遗产》会登陆NS：但WB不愿透露发行形式

男孩叛逆期怎么沟通，男孩叛逆期怎么沟通呢

冻顶乌龙茶价格,冻顶乌龙茶因何久负盛名

老人|老人被狗绳绊倒身亡，给这些人敲响警钟！

「钱江晚报小时新闻」海警雷达搜索发现4艘船舶整队航行，他们为啥拒不停船？傍晚时分

欧洲硅谷在哪里听留学中介说爱尔兰现在计算机找工作不错，有了解欧洲计算机行业发展的人介绍一下吗

我想知道有没有人和我一样无聊，对啥都没有兴趣，啥也不想干，不知道活着的意义

虐心最帅|曾单挑吕布，战平马超，曹操手下第一猛将

评分|花120万购买一个账号，玩家还觉得很划算，这款网游人均土豪？

北京日报|北京最新天气预报：注意保暖！本市下午部分地区有零星小雨

『河青新闻网廊坊新闻』大城县中医医院·复工复产 |内科全力以赴

女屌丝怎样找男朋友

明星八卦|有一种差距叫00后男明星粉丝数，周震南最少，易烊千玺一骑绝尘

烹饪|茄子和它天生是一对，多做给家人吃，简单一煮，比吃肉还营养！

「奔驰C级」开奔驰C200L的都是什么阶层的人？月薪6000能不能养得起？

孟晚舟@?重现“孟晚舟事件”？美国突然公布，谁也没想到，一切来得如此快

王者联盟|王者荣耀：新版本大洗牌，中路法王或将重新崛起