Short-term traffic flow prediction methods comparison of road networks
-
摘要: 介绍了用于短期交通流预测的两大类模型: 统计预测算法和人工神经网络模型。对其中各种模型的特征进行了比较, 将历史平均模型、求和自回归滑动平均模型(ARIMA)、非参数回归模型、径向基函数(RBF) 神经网络模型与贝叶斯组合神经网络模型, 应用于一个真实路网的短期流量预测, 比较了各模型的预测结果。结果表明, 组合神经网络模型预测误差最小, 可靠性最高, 是一种对短期交通流预测的有效方法。Abstract: A large number of techniques have been applied into short-term traffic flow prediction, which can be classified into two groups: statistical models and artificial neural network model. The models and their application were discussed and compared. Several models, including historical average, ARIMA (auto regressive integrated moving average) model, nonparametric regression, RBF (radial basis function) neural network and Bayesian combined neural network model were applied into a numerical example of short-term traffic volume prediction in a field network, their prediction results and performances were compared. It was found that the error of hybrid neural network model is littlest, its prediction reliability is highest, it is the most effective method to predicte short-term traffic flow.
-
Key words:
- traffic engineering /
- short-term traffic flow /
- prediction /
- methods /
- comparing
-
0. 引言
道路交通拥挤是目前全世界尤其是一些大中城市面临的紧迫问题。借用经济学的观点, 交通拥挤是交通供需之间存在矛盾的体现, 即交通供给无法满足交通的需求。因此针对这一矛盾的解决方法, 可以归纳为: 依靠各种设施和手段提供更多的交通供给; 通过各种政策调整和降低交通需求; 动态交通管理(Dynamic Traffic Management, 简称DTM), 是通过各类实时、动态的交通管理策略来提高交通供给与交通需求之间的配对, 从而提高交通供给的使用效率和服务水平。
动态交通管理主要是针对当前实时状态以及近期可能出现的路网交通流状况, 即供需之间的不搭配, 而给出对交通流的调节措施。这些措施首先要针对路网当前的交通状况, 是一种被动应付这些交通状况而采取的策略。还有一类动态交通管理措施, 称之为主动型控制和诱导策略, 即对下一阶段可能出现的交通供需不配对矛盾预先主动采取一定措施予以缓和或化解。精确的交通预测模型对于路径诱导和交通流控制很重要[1], 采用现有实时的交通数据来连续预测未来几分钟时段内的交通流量和路段旅行时间, 是提供动态交通控制和诱导的一个先决条件[2]。
1. 预测模型和方法
所谓短期交通流预测是要预测某条道路或某个交通走廊在未来几分钟直至几个小时内交通流状况的变化情况。这一预测可以用以制订和实施某项交通管理计划, 对交通流进行调节, 以减缓这一期间可能出现的交通拥挤和危险隐患。相对于战略预测或长期预测来说, 短期交通流预测有着明显较短的预测期限。前者通常是预测某一地区或区域未来几年到十几年期间内的交通需求, 从而为该地区的交通规划以及交通基础设施建设和服务提供依据, 其常用的方法包括传统的4阶段法、组合模型以及非集聚模型等。
对短期交通流状况的预测可以反映为对交通流3大参数的预测, 即交通流量、速度和密度预测。短期交通流预测一直是一个比较活跃但结果却不令人满意的研究课题[3]。到目前为止, 已经有一系列的技术方法和手段被开发应用于短期交通流的预测, 这些方法可以归为2大类: 数学或统计预测算法与人工智能或神经网络预测模型。这些模型在交通流参数的短期预测中均有应用。
1.1 统计预测算法
迄今已有多种数学算法被开发, 并应用于短期交通流量的预测, 这些算法从原理上分为2大类: 统计方法和时间序列分析方法。2类方法都尝试把交通流参数看成一个时间变量, 从而找到这一时间序列中隐含的统计规律或关系。一些常用的数学算法包括如简单的移动平均、线性回归、求和自回归滑动平均(ARIMA) 模型、指数平滑模型、卡尔曼滤波理论以及非参数回归模型等。
1.1.1 求和自回归滑动平均模型
求和自回归滑动平均(Auto Regressive Integrated Moving Average, 简称ARIMA) 模型是由(Box and Jenkins, 1977) 提出的一种时间序列模型[4]。模型的基本思想是对于任何一个从等时间间隔取出的平稳时间序列Xt, 假设其均值为μ, 都可以用以下线性模型表示
Φp(B)(1-B)d(Xt-μ)=Θq(B)at (1)BXt=Xt-1Φp(B)=1-α1B-⋯-αpBpΘq(B)=1+β1B+⋯+βqBq
式中: B为后移位算子; p、d、q为非负整数参数; Φp (B) 为p阶自回归算子; αi (i=1, …, p) 为参数; Θq (B) 为q阶移动平均算子; βj (j=1, …, q) 为参数; at为服从独立正态分布N (0, σa2) 的白噪声序列。
式(1) 表达的模型通常被称为ARIMA (p, d, q) 模型, 其中(p, d, q) 代表模型的阶数, 而不同的p、d、q组合可以使模型不断优化, 从而找到最适合给定时间序列的模型。ARIMA模型常常需要大量的历史数据来标定模型参数, 而模型的参数又随着时间和地点而变动, 因此很难应用于在线预测, 且其预测性能不稳定。
1.1.2 指数平滑模型
指数平滑模型主要是要在预测过程中不断考虑最新观测值对预测的纠正, 从而综合前序预测的误差加入到下一次的预测中, 经反复迭代, 最终形成的预测结果是一个对所有前面观测值的线性组合。其权重是不断衰减的指数权值, 而且相对来说观测值越近, 其在预测偏差的纠正上所占的权重值越大, 这也正是指数平滑的得名由来。目前主要有2种做法: 单次指数平滑(Single Exponential Smoothing) 和二次指数平滑(Double Exponential Smoothing)。
指数平滑模型采用递归式计算, 对数据的存储要求较低, 只需存储前一个估计值和过滤参数; 计算比较简单, 不需要训练, 因此早期应用较多。
1.1.3 卡尔曼滤波理论
卡尔曼滤波[5]包含一组方程, 使得一旦得到新的观测值后, 预测模型可以更新。预测过程分为2步: 根据现有数据形成对下一个观测值的最佳预测模型; 然后再将最新的观测值用更新方程加入预测向量中。假设Xt代表在t时刻的交通流量, 是一个m维的向量, 引入以下模型预测k个时间区间之后的交通流量Xt+k
Xt+k*=H0 (t) xt+H1 (t) xt-1+…+Hr (t) xt-r+wt (2)
式中: Xt+k*为Xt+k的预测值; Hj (t) 为m×n维参数矩阵(j=0, 1, …, r); xt-j为用于预测Xt+k*所需的n维交通参数向量, 根据以前观测或工程经验确定(j=0, 1, …, r); wt为噪声向量。
式(2) 中xt可以直接量测, 而Hj (t) 则可以根据滤波理论转化为借助卡尔曼增益矩阵对相对应最佳状态向量进行估计得到。
1.1.4 非参数回归模型
非参数回归主要依赖历史数据描述因变量和自变量之间的关系, 把系统的状态描述为一个过去状态的“近邻状态”, 而且认为这种从过去观察到的系统聚集的近邻状态和当前要预测的状态是类似的。
当充分的数据准备好之后, 非参数回归的主要任务便是定义近邻状态, 产生估计。目前有2种常用的定义方法: 核近邻状态[6]和最近近邻状态[7]。核近邻状态定义在一个带有常带宽的自变量空间, 而最近近邻状态则涉及固定数量的样本, 因此也称为k最近近邻状态(KNN) 参数回归。
1.2 神经网络预测模型
由于神经网络在描述非线性系统方面有杰出表现, 自20世纪90年代以来在交通工程领域被逐渐应用, 其中一个重要方面是短期交通流量的预测[8]。神经网络模型也被证实适合用于描述交通流系统的非线性特征[9]。
神经网络模型是由一系列简单但相互连接的处理单元构成的一个计算系统[10]。在一个神经网络模型中, 除去输入、输出变量外, 最核心的变量就是各层之间的连接权重。连接权重的确定与回归模型中回归参数的确定十分类似, 使得模型能够拟合给定的历史数据, 通过大量历史数据确定连接权重。当一个神经网络模型“学习”得到输入和输出变量的关系之后, 即可用于对给定输入的预测。迄今已有多种不同的神经网络模型被应用于短期交通流量的预测, 例如反向传播(Back Propagation, 简称BP) 神经网络[11]、径向基函数(Radial Basis Function, 简称RBF) 神经网络[12]、时间迟滞神经网络(Time Delay Neural Network, 简称TDNN) [13]与时间迟滞性循环神经网络(TLRN) 等[14]。
混合神经网络或模块神经网络模型的主要特征是首先借助神经网络模型对交通流的模式进行分类, 然后针对每一类交通模式分别采用单个合适的模型进行描述和预测。由于交通流本身就是一个由多因素引起的复杂过程, 各种因素都对交通流的模式产生一定的影响, 因而采用这样一种混合模型综合描述和预测各因素对交通流的影响是合适的[15-17]。
1.3 模型小结
(1) 部分数学统计模型, 如求和自回归滑动平均模型、指数平滑模型、历史平均模型等, 主要依靠单一观测点的历史数据进行交通流预测, 而没有考虑相邻观测点流量之间存在的特征关系, 因此不管这些模型对交通数据多么贴近, 都只是数学表达式上的逼近, 而并没有代表真实意义上的交通流特征。
(2) 卡尔曼滤波方法以及非参数回归模型除了考虑研究路段上的交通流之外, 同时也考虑来自上游路段交通流的因素。但哪些具体因素对于预测有影响, 需要前序研究或交通工程师的经验判断, 这将直接影响预测的精度。
(3) 神经网络模型在描述非线性系统方面有杰出表现已经被大家认可, 虽然他们都倾向于采用“黑盒子”方式描述输入输出间的关系, 使模型结构被掩盖, 但是作为描述交通流模型的有力工具, 一方面他考虑了交通流在时空上的关系特性, 借用对大量历史数据的学习代替了模型结构中大量参数的估计过程。而近来基于这些模型之上的一种混合神经网络模型表现出了更为优异的性能。
2. 预测分析比较
选取图 1路网为例, 挑选上述模型中的一些进行应用比较研究。沿着路网选取3个点, 分别收集其在8∶00到20∶00之间的每15 min时段内的交通流量数据, 从而形成2个数据集合: 训练集和验证集。训练集主要用于对一些前期需要训练的模型进行训练, 而验证集则用于对模型的测试检验。集合中的每条数据记录格式为: V (t-15, 1)、V (t-15, 2)、V (t, 1)、V (t, 2)、V (t, 3) 和V (t+15, 3), 其中V代表流量, t代表当前时刻(min), 1~3为观测点的编号。预测的主要任务定义为预测地点3在下一时段的交通流量, 即V (t+15, 3), 而在一些模型的预测中可能用到上游路段及前2个时段内的交通流量数据。本文选取以下几个模型在路网和交通流条件下进行测试和应用对比: 历史平均模型、ARIMA (0, 1, 1) 模型、非参数回归模型、RBF神经网络和组合神经网络模型。
(1) 历史平均模型:
历史平均模型的表述为
∧V(t+15)=ˉVhist(t+15)
即预测时段的流量等于历史条件下相同时段的平均值, 模型不需要训练。
(2) ARIMA (0, 1, 1) 模型:
阶数为(0, 1, 1) 的ARIMA模型等同于单次指数平滑模型, 表述为
∧V(t+15)=∧V(t)+α[V(t)-∧V(t)]
α取0.7, 模型无需训练。
(3) 非参数回归模型:
选取固定样本数为3的k最近近邻状态估计, 即每次都从历史数据中选取3个与估计状态最近的样本, 用于下一时段的估计。
(4) RBF神经网络模型:
由于采用5个输入变量, V (t-15, 1)、V (t-15, 2)、V (t, 1)、V (t, 2)、V (t, 3), 分别代表上游2个路段在上2个时段内以及预测路段上一时段的流量, 因此输入层选用5个神经元; 采用1个中间层, 选取带有36个中心的高斯函数为作用函数; 输出层则因只有1个预测结果变量, 只有1个神经元。
(5) 组合神经网络模型:
基于贝叶斯准则和条件概率理论的组合模型, 有关模型的细节可参考文献[17]。
为了比较模型的预测性能, 同时与真实交通流量对比分析, 本文引入2个比较指标: 预测误差均值(EMAPE) 和误差分布概率(EPPE)。其中前者是预测相对于真实流量的百分比误差的总均值, 代表了模型的预测精度; 而后者是保证预测落在一定误差范围(如±10%) 内的概率, 即为预测的可靠性, 见表 1。
表 1 误差均值和误差分布概率比较Table 1. Comparison of MAPE and PPE模型 EMAPE/% EPPE 历史平均 12.47 0.69 ARIMA (0, 1, 1) 14.87 0.65 非参数回归 11.54 0.71 RBF神经网络 11.06 0.75 组合神经网络 10.20 0.80 从表 1中可以看出, 在5个模型中, 神经网络模型保持有较好的预测性能; 非参数回归模型虽然也是基于历史数据的平均, 但由于其加入了对样本空间的判断和选择, 因此作为一个非基于参数的模型, 仍具有可圈点的性能表现; 而ARIMA (0, 1, 1), 或所谓的单次指数平滑模型, 性能不稳定。
某一天内上述5个模型对交通流量的预测值与真实观测值的对比结果见图 2。整体上看, RBF神经网络和组合神经网络模型跟真实值变化的趋向符合较好, 但RBF模型在最后几个区间的预测出现了很大误差, 而组合神经网络模型则很好地规避了这一点。根据以上模型的应用过程, 各模型应用的主要优、缺点见表 2。
表 2 应用比较Table 2. Application comparison模型 优点 弱项 历史平均 操作简单易行 无法表现交通流变化 ARIMA (0, 1, 1) 时间序列过程的应用 很难处理数据有空缺的情形 非参数回归 无需假定变量关系 对近邻状态的定义不易掌握 RBF神经网络 适合于复杂、非线性关系的描述 “黑盒子”的系统结构 组合神经网络 实时跟踪、自适应调整预测性能 需调试训练多个模型 3. 结语
本文论述了短期交通流预测在动态交通管理解决交通拥挤中的意义, 着重回顾了短期交通流量预测的数学统计预测模型和人工神经网络预测模型, 并对各种模型进行了简单评述。通过选取几个具代表性的模型, 应用到一个实际路网的短期交通量预测中进行了比较验证。验证的结果发现, 神经网络模型在描述交通流系统非线性特征关系, 以及刻画多因素对交通流模式的影响方面有优异的表现。在目前各种预测模型相对实际工程应用尚有一段距离的情况下, 以交通流模式划分和对各个交通流模式进行进一步描述为特征的组合神经网络模型将会是进一步研究的方向。
-
表 1 误差均值和误差分布概率比较
Table 1. Comparison of MAPE and PPE
模型 EMAPE/% EPPE 历史平均 12.47 0.69 ARIMA (0, 1, 1) 14.87 0.65 非参数回归 11.54 0.71 RBF神经网络 11.06 0.75 组合神经网络 10.20 0.80 表 2 应用比较
Table 2. Application comparison
模型 优点 弱项 历史平均 操作简单易行 无法表现交通流变化 ARIMA (0, 1, 1) 时间序列过程的应用 很难处理数据有空缺的情形 非参数回归 无需假定变量关系 对近邻状态的定义不易掌握 RBF神经网络 适合于复杂、非线性关系的描述 “黑盒子”的系统结构 组合神经网络 实时跟踪、自适应调整预测性能 需调试训练多个模型 -
[1] Ben-Akiva M, Koutsopoulos H N, Mukundan A. A dynamic traffic model system for ATMS/ATIS operations[J]. IVHS Journal, 1994, 2 (1): 1-19. [2] CheslowM, Hatcher S G, Patel VM. An initial evaluation of alternative intelligent vehicle highway systems architecture[R]. MITRE Report 92w0000063, MITRE Corporation, 1992. [3] Davis G A, Nihan N L. Nonparametric regression and short term freeway traffic forecasting[J]. Journal of Transportation Engineering, 1991, 117(2): 178-188. doi: 10.1061/(ASCE)0733-947X(1991)117:2(178) [4] BoxG E P, JenkinsGM. Time series analysis: forecasting and control [R]. San Francisco: Holden-Day, 1977. [5] Kalman R E. A new approach to linear filtering and prediction problems[J]. Journal of Basic Engineering, 1960, 82(1): 35-45. doi: 10.1115/1.3662552 [6] Okutani I, Stephanedes Y J. Dynamic prediction of traffic volume through Kalman filtering theory[J]. Transportation Research, Part B, 1984, 18(1): 1-11. doi: 10.1016/0191-2615(84)90002-X [7] Altman NS. An introduction to kernel and nearest-neighbor nonparametric regression[J]. The American Statistician, 1992, 46(3): 175-185. [8] Dougherty MS. A review of neural networks applied to transport[J]. Transportation Research, Part C, 1995, 3(4): 247-260. [9] Zhang H J, Ritchie S G, Lo Z P. Macroscopic modeling of freeway traffic using an artificial neural network[J]. Transportation Research Record, 1997, 1588: 110-119. doi: 10.3141/1588-14 [10] Faghri A, Hua J. Evaluation of artificial neural network applications in transportation engineering[J]. Transportation Research Record, 1992, 1358: 71-80. [11] Dougherty M S, Kirby H C. The use of neural networks to recognize and predict traffic congestion[J]. Traffic Engineering and Control, 1993, 34(6): 311-314. [12] Park B, Messer C J, Urbanik T. Shortterm freeway traffic volume forecasting using radial basis function neural network[J]. Transportation Research Record, 1998, 1651: 39-47. doi: 10.3141/1651-06 [13] Abdulhai B, Porwal H, Recker W. Short-term freeway traffic flow prediction using genetically-optimized time-delay-based neural networks [R]. Institute of Transportation Studies, University of California, 1998. [14] Dia H. An object-oriented neural network approach to short-term traffic forecasting[J]. European Journal of Operational Research, 2001, 131(2): 253-261. doi: 10.1016/S0377-2217(00)00125-9 [15] Van D V, Dougherty M, Watson S. Combining kohonen maps with ARIMA time series models to forecast traffic flow[J]. Transportation Research, Part C, 1996, 4(5): 307-318. [16] Park D, Rilett L R. Forecasting multiple-period freeway link travel times using modular neural networks[J]. Transportation Research Record, 1998, 1617: 163-170. doi: 10.3141/1617-23 [17] Lee D, Zheng W, Shi Q. Short-term freeway traffic flow prediction using a combined neural network model[A]. The 83rd Annual Meeting of TRB[C]. Washington D C: TRB, 2004. -