课题组在面向大规模城市交通感知的智能边缘计算研究方面取得新进展

重庆大学计算机学院大数据与智慧计算(BDSC)课题组硕士研究生(一年级)张昭同学(第二作者,导师向朝参副教授为第一作者)完成的论文“Edge Computing-Empowered Large-scale Traffic Data Recovery Leveraging Low-rank Theory”[2]被计算机网络领域著名期刊《IEEE Transactions on Network Science and Engineering》(SCI JCR一区,IF=5.2)录用。该研究成果与上海交通大学电子信息与电气工程学院吴帆教授团队、中国科学技术大学计算机学院杨盘隆教授以及澳大利亚悉尼科技大学范晓宸博士合作完成。此项成果是该团队2020年在智慧交通与智能建筑跨域感知学习成果[1](发表在IEEE Transactions on Mobile Computing 2020, SCI JCR一区,CCF A)的基础上,在智慧交通感知与边缘计算相结合的又一个新突破。

图 1 论文在线发表和期刊截图

智能交通感知系统(Intelligent Transportation System, ITS)将数据通信技术、电子控制技术、信息技术、人工智能技术、计算机技术等先进技术应用于城市安全、高效、方便的交通运输管理,正被各个城市大规模广泛地应用。但是经过实际ITS系统的调研发现,由于系统自身硬件故障、数据传输失败等原因,很多实际ITS系统存在大量的感知数据缺失。随着ITS系统的日益普及以及基于交通感知数据的广泛应用,获取完整精确的交通感知数据已经成为亟待解决的重要问题。

图 2 悉尼新南威尔士州的交通流量监控系统

为了解决ITS中交通感知数据缺失的问题,本研究做了大量的实验和调研来探索交通感知数据(即交通流量)的时空相关性。如图2所示,本研究基于TVVS的数据集里采集了悉尼25个站点一年(2018年1月1日~2018年12月31日)的交通感知数据,采样间隔为1小时。

1)时间相关性分析:通过将1年分为52周,本研究分析了同一交通站不同周的交通感知数据之间的相关性。如图3a所示,每周的交通感知数据的趋势基本相似,同时由于人们的作息习惯,其中周末的感知数据有异于工作日。因此得出结论,每周的交通感知数据之间具有相关性。为了定量地分析,本工作计算了这52周两两之间的Pearson相关系数。如图3b所示,其中所有站点的相关性系数都高于0.6,其中高于0.95的占到了80%。这进一步说明了同一站点每周的交通流量数据具有较强的相关性。但是,如图3a所示,某些天的交通感知数据具有反常的波动,例如四月的第一周星期二是澳大利亚的ANZAC Day。该天全国民众都会放假,从而影响了交通流量。因此,交通感知数据可能会受到特殊社会事件、节日和天气等因素的影响。

图 3 同一交通站的不同周交通感知数据的时间相关性分析

2)空间相关性分析:首先,本研究比较了不同交通站点的交通感知数据。图4a展示了不同站点的交通感知数据。由于结果是类似的,文章只展示了某四个站点第一周的数据。结果表明不同站点的交通感知数据具有相关性(包括星期二的特殊节日)。此外,还计算了不同站点交通流量之间的Pearson相关性。如图4b所示,文章使用混淆矩阵展示了23个站点之间的相关系数。实验结果显示,大部分站点之间的相关系数在0.8以上。因此,不同的交通站点的交通流量具有空间相关性。原因是道路之间是相互连接的,因此不同交通站之间的交通感知数据会相互影响。然而,图4b显示一部分站点(如1,2,3,4)与其他站点相比具有较低的相关性。出现这种现象的原因是距离过远会降低不同交通站之间的相关性。

图 4 不同交通站之间的空间相关性分析

综上可以看出,交通感知数据在同一站点的每周之间以及不同站点的相同时段之间具有时间和空间相关性。然而,实现大规模交通感知数据恢复仍面临以下三个挑战:1)资源敏感型交通感知数据的计算存储开销大。许多ITS系统使用交通探头来监视道路的实时交通数据,这些视频数据会带来大量计算和存储开销。2)单个交通站计算和存储能力受限。ITS一般覆盖区域很大,同时交通站点数量庞大(如悉尼TVVS系统就有超过600个站点)。因此,由于成本的限制,每个站点的硬件配置较低。3)数据传输的延时高。受到数据存储体积、传输距离和带宽的限制,特别是各个站点集中向中心服务器发送数据的时候,大容量数据传输会导致较高的延时。当交通站和云服务中心的传输距离过长时,大规模的ITS系统的延迟会更高。简而言之,由于成本和数据规模的限制,利用单个站点很难直接恢复交通数据。另一方面,由于高延迟和数据实时性的要求,使用传统云计算也面临着很多挑战。因此,考虑计算、存储和传输的问题,利用单个交通站或者传统云计算在大规模的ITS系统上进行准确、实时的交通感知数据恢复都非常困难。

图 5 基于边缘计算的大规模ITS交通流量数据恢复系统框架

为了解决这些问题,文章提出了一种基于边缘计算的低延迟、高精度的大规模ITS交通感知数据恢复系统架构,如图5所示。这个架构包括交通站、边缘节点和中心服务器。基于该交通感知数据恢复系统,本工作主要研究边缘节点的最优部署,以及基于边缘计算的精确交通感知数据恢复。为了解决以上两个问题,文章提出了利用边缘计算和低秩理论的高精度实时大规模ITS交通感知数据恢复系统(GTR),如图6所示。

图 6 基于边缘计算和低秩理论的大规模交通感知数据恢复系统(GTR)

最后,基于TVVS的真实ITS交通感知数据对边缘节点部署的总花费和感知数据恢复的精度两个方面进行评估。如图7和8所示,实验结果表明,该系统能够得到近似最优边缘节点部署,即比最优部署的耗费增加了5.7%。同时,交通感知数据恢复精度比四种对比方法提高了63.8%。

图 7 基于实际大规模交通感知数据的边缘节点部署性能评估结果

图 8 基于实际大规模交通感知数据的缺失数据恢复性能评估结果

小结:本研究提出了一种具有性能理论保证的次优边缘节点部署方案和基于低秩理论的交通感知数据精确恢复算法,将大规模交通感知数据处理与边缘计算巧妙地结合,从而实现了面向城市大规模交通感知系统中缺失数据的高效、实时、精确恢复。

 

相关成果文献:

[1] Xiaochen Fan, Chaocan Xiang*, Chao Chen, Xudong Song, Panlong Yang, Liangyi Gong, Priyadarsi Nanda, Xiangjiang He, BuildSenSys: Reusing Building Sensing Data for Traffic Prediction with Cross-domain Learning, IEEE Transactions on Mobile Computing, 2020 (SCI JCR 1 区, CCF A 类期刊)

[2] Chaocan Xiang, Zhao Zhang, Yuben Qu, Dongyu Lu, Xiaochen Fan, Panlong Yang, Fan Wu, Edge Computing-Empowered Large-scale Traffic Data Recovery Leveraging Low-rank Theory, IEEE Transactions on Network Science and Engineering, 2020 (SCI, JCR 1区,IF=5.2)