|更精确地预估到达时间,滴滴新研究提出异质时空图卷积网络


机器之心发布
机器之心编辑部
「师傅 , 还有多长时间能到啊?」在打的赶往目的地时 , 我们经常会问这样一个问题 。 但如果我们打的是滴滴 , 这个问题就不用开口问了 。 因为 , 滴滴的研究者正不断挑战更加精确的到达时间预估结果 , 相关结果被 KDD 2020 接收为Oral论文 。
第 26 届 ACM SIGKDD 知识发现和数据挖掘会议(KDD 2020)正以线上形式召开 。 今年 KDD 应用数据科学方向 (Applied Data Science Track) 共收到 756 篇论文投稿 , 收录 121 篇 , 接收率约为 16.0% , 其中 Oral 论文 44 篇、Poster 论文 77 篇;KDD 研究方向 (Research Track) 有 1279 篇论文投稿 , 收录 216 篇 , 接收率约为 16.9% 。
在本届大会中 , 滴滴的《HetETA: Heterogeneous Information Network Embedding for Estimating Time of Arrival》被接收为 Oral 论文 。 在这篇论文中 , 滴滴 AI Labs 技术团队针对预估到达时间任务构建了一个异质时空图 , 并提出了 HetETA 框架来挖掘时空图中的丰富语义信息 , 有效提升了预估到达时间任务的精确度 。 本文是对这篇论文的详细解读 。
|更精确地预估到达时间,滴滴新研究提出异质时空图卷积网络
本文插图

论文地址:https://dl.acm.org/doi/pdf/10.1145/3394486.3403294
代码地址:https://github.com/didi/heteta
研究背景与挑战
随着人们与日俱增的出行需求 , 智慧交通系统已成为城市建设中不可或缺的角色 。 预估到达时间(Estimated Time of Arrival , ETA)是智慧交通系统中尤为关键的一项任务 , 根据给定的出发时间 , 精确地预估出从起点到终点所需时长 , 有助于节省用户的出行时间 , 优化车辆调度和路径规划等 。 ETA 任务与道路交通速度预测密切相关 , 即当道路的交通速度(或道路拥堵程度)已知时 , 可通过道路长度将道路的交通速度转化为通过该道路所需的时间 。
当前大多数工作致力于建立丰富的特征系统来提高 ETA 任务的准确性 , 然而这些特征系统很少考虑到空间信息的构建与挖掘 。 如图 1 所示 , 地图中的道路网络实际上是一种含有多个链接关系的异质图 , 而这些道路之间的链接关系(即空间信息)对于道路交通速度预测至关重要 。 例如图 1 中的路段 1 如果是拥堵的 , 那么路段 1 的前方直行道路 2 大概率也会是拥堵的 。
|更精确地预估到达时间,滴滴新研究提出异质时空图卷积网络
本文插图

图表 1:地图数据到异质图的转换
又比如在高速上直行的车辆速度一般高于向右驶出闸道的车辆 。 然而地图中的道路网络是一个大规模的稀疏网络 , 以包含了 7 万多个主干道的沈阳市为例 , 其道路网络的平均度数为 2.52 , 即一条道路路段一般只链接 2~3 条道路 。 这样的大规模稀疏网络难以直接使用需要充足邻居信息的图神经网络(Graph Neural Network , GNN)进行网络的表示学习(representation learning/network embedding) 。
除了地图数据中的道路网络 , 车辆轨迹信息也是一种描述道路之间链接关系的空间信息 。 例如图 2 中青年大街的车辆大部分流向了太原街(沈阳市具有火车站和客运站的交通枢纽)和中街(沈阳市著名购物街) 。 大量的车辆轨迹组成了车流信息 , 隐含了城市的交通模式以及驾驶经验、偏好信息 , 这些信息很难直接从地图数据中的道路网络中得到 , 因此需要对道路网络和车流信息进行联合建模 。
|更精确地预估到达时间,滴滴新研究提出异质时空图卷积网络
本文插图

图表 2:沈阳车流示意图
此外 , ETA 任务也与道路交通速度的时序信息息息相关 。 直观来说 , 若某路段在当前时刻为拥堵状态 , 则下一时刻该路段大概率仍为拥堵状态 , 即道路下一时刻的交通状态与近期时刻的交通状态(近期路况)相关 。


推荐阅读