|训练时间和参数量百倍降低，直接使用标签进行预测，性能超GNN( 二 )

具体而言，该方法首先使用一个基于节点特征的基础预测器，它不依赖于任何图学习。然后，执行两种类型的标签传播 (LP)：一种通过建模相关误差来校正基础预测；一种用来平滑最终预测。研究人员将这两种方法的结合称作 Correct and Smooth（C&S ，参见图 1）。 LP 只是后处理步骤，该 pipeline 并非端到端训练。此外，图只在后处理步骤中使用，在前处理步骤中用于增强特征，但不用于基础预测。这使得该方法相比标准 GNN 模型训练更快速，且具备可扩展性。
该研究还利用两种 LP 和节点特征的优势，将这些互补信号结合起来可以获得优秀的预测结果。
实验
为了验证该方法的有效性，研究者使用了 Arxiv、Products、Cora、Citeseer、Pubmed、Email、Rice31、US County 和 wikiCS 九个数据集。

本文插图

节点分类的初步结果
下表 2 给出了相关实验结果，研究者得出了以下几点重要发现。首先，利用本文提出的 C&S 模型， LP 后处理步骤会带来巨大增益（如在 Products 数据集上， MLP 的基础预测准确率由 63% 提升至 84%）；其次，具有 C&S 框架的 Plain Linear 模型的性能在很多情况下优于 plain GCN ，并且无可学习参数的方法 LP 的性能通常也媲美于 GCN 。这些结果表明，通过简单使用特征在图中直接合并关联往往是更好的做法；最后， C&S 模型变体在 Products、Cora、Email、Rice31 和 US County 等 5 个数据集上的性能通常显著优于 SOTA 。在其他数据集上，表现最佳的 C&S 模型与 SOTA 性能之间没有太大的差距。

本文插图

使用更多标签进一步提升性能
下表 4 展示了相关结果，强调了两点重要发现。其一，对于想要在很多数据集上实现良好性能的直推式节点分类实验而言，实际上并不需要规模大且训练成本高的 GNN 模型；其二，结合传统的标签传播方法和简单的基础预测器能够在这些任务上优于图神经网络。

本文插图

更快的训练速度，性能超过现有 GNN
与 GNN 或其他 SOTA 解决方案相比，本文中的 C&S 模型需要的参数量往往要少得多。如下图 2 所示，研究者绘制了 OGB-Products 数据集上参数与性能（准确率）的变化曲线图。

本文插图

除了参数量变少之外，真正的增益之处在于训练速度更快了。由于研究者在基础预测中没有使用图结构，与其他模型相比， C&S 模型在保持准确率相当的同时往往实现了训练速度的数量级提升。
具体而言，与 OGB-Products 数据集上的 SOTA GNN 相比，具有线性基础预测器的 C&S 框架表现出更高的准确率，并且训练时长减至 1/100 ，参数量降至 1/137 。
性能可视化
为了更好地理解 C&S 模型的性能，研究者将 US County 数据集上的预测结果进行了可视化操作，具体如下图 3 所示。正如预期的一样，对于相邻 county 提供相关信息的节点而言，残差关联往往会予以纠正。

本文插图

|训练时间和参数量百倍降低，直接使用标签进行预测，性能超GNN( 二 )

推荐阅读

内心忐忑的小时|朱一龙为杨蓉庆生，延续6年的祝福太暖心，祝你做自己的光，原创

冷天早餐，不糊弄不将就，学学7天不重样，孩子吃得好精神也充足

[牛仔裤]牛仔裤修饰身形的效果非常的好，简约而又不失淑女的时尚气质

幽默搞笑段子集锦|幽默笑话：男友在我脖子上留了个吻痕，回家被老妈发现了！，原创

《武学宗师》启巡演：以中国式话剧展近代武学名家之魂

『澳大利亚』澳称鉴于印太地区形势变化将采购远程导弹，中方表态

天冷了，吃牛肉不如吃它，上锅蒸一蒸，清香鲜美，冬天的佳肴

蓓小西|从打扮中就看得出，谁的野心比较大，范冰冰、马苏同框高调看秀

哈萨克斯坦明日直播总统大选电视辩论，7名候选人将一逞辩才

喝红茶的点心,广州茶的特点

华炬名茶携手知名酒庄演绎茶酒文化

上海浦东报告1例确诊病例：浦东机场货运站从事搬运工作已追踪密接者26人

健康|十个女的九个有炎症，坚持吃一物，杀菌消炎，子宫越来越健康

「国民党」此人是国民党少校，却指挥得动少将，建国后在刑场上被解放军救下

买鲈鱼时，要分清“河鲈”和“海鲈”，区别挺大，弄懂再买不吃亏

旅途结束返程的诗句?旅游返程的唯美句子

科技创新▲中国天量的货币应该流向哪里？

百家讲坛讲哪几集可以帮助高中的学习

「陈法蓉」陈法蓉奔六年纪有少女心，衣服上带荷叶花边，短发也能穿出女人味

补肾|肾虚“别忙补”，老中医：“3招”补肾气，简单易学！