Nonlinear effect of station-area built environment on taxi-metro combined travel
-
摘要: 预处理出租车轨迹数据并提取了出租车行程数据;识别了地铁运营时段内出租车-地铁组合出行,分类为接入出行、接出出行,并划定了地铁站点的潜在影响范围;采用极限梯度提升模型分析了站域建成环境对出租车-地铁组合出行的非线性影响,并引入SHAP模型解释了非线性特征的重要性、方向及阈值现象;运用必要条件分析方法探索了站域建成环境要素对出租车-地铁组合出行的必要性。研究结果表明:站域建成环境对不同类别的出租车-地铁组合出行具有不同的贡献度,其中土地利用混合度、公交站点密度、路网密度、居住用地密度对出租车-地铁组合出行具有显著的必要性;早高峰期间,影响接入出行的重要要素依次是公交站点密度、居住用地密度和路网密度,重要度分别为33.38%、30.10%、19.33%,影响接出出行的重要要素依次是公交站点密度、居住用地密度和路网密度,重要度分别为41.48%、15.61%、14.41%;晚高峰期间,影响接入出行的重要要素依次是居住用地密度、路网密度和公交站点密度,重要度分别为34.13%、23.84%、23.13%;影响接出出行的重要要素依次是居住用地密度、公交站点密度和土地利用混合度,重要度分别为40.88%、20.32%、14.72%;公交站点密度的SHAP值呈现3个阶段变化,以每平方公里15和50个站点为阈值点;路网密度在14 km·km-2处为重要分界点,低于该值对租车-地铁组合出行为负向贡献,高于该值为正向贡献;居住用地密度超过0.45 m2·km-2时对租车-地铁组合出行为正向贡献且趋于稳定。Abstract: The taxi trajectory data was preprocessed and taxi trip data was extracted. Taxi-metro combined travel was identified and categorized into subway extending access (SE-access) trips and subway extending egress (SE-egress) trips, and potential influence areas of subway stations were identified. The extreme gradient boosting (XGBoost) model was employed to analyze the nonlinear effects of station-area built environment on taxi-metro combined travel. The Shapley additive explanations (SHAP) model was introduced to explain the nonlinear characteristics: importance, orientation, and threshold phenomena. The necessity of station-area built environment factors for taxi-metro combined travel was analyzed using necessary condition analysis method. Analysis results indicate that the station-area built environment contributes differently to various types of taxi-metro combined travel, with land use mix, bus station density, road network density, and residential land density significantly necessary for taxi-metro combined travel. During the morning peak hours, key factors influencing SE-access trips are bus station density, residential land density, and road network density, with importance values of 33.38%, 30.10%, and 19.33%, respectively. For SE-egress trips, key factors are bus station density, residential land density, and road network density, with importance values of 41.48%, 15.61%, and 14.41%, respectively. During the evening peak hours, key factors influencing SE-access trips are residential land density, road network density, and bus station density, with importance values of 34.13%, 23.84%, and 23.13%, respectively. For SE-egress trips, key factors are residential land density, bus station density, and land use mix, with importance values of 40.88%, 20.32%, and 14.72%, respectively. The SHAP value of bus station density changes with a three-stage trend, with 15 and 50 stations per square kilometer as threshold points. For road network density, 14 km·km-2 is a critical demarcation value, meaning that the road network density below this threshold negatively contributes to taxi-metro combined travel, while the road network density above this threshold contributes positively. When residential land density exceeds 0.45 m2·km-2, it positively contributes to taxi-metro combined travel and tends to remain stable.
-
0. 引言
地铁是城市居民出行的主要方式之一,因其“站到站”的服务特征,往往需与公交、出租车(网约车)、共享单车等公共交通换乘(公交-地铁、出租车-地铁组合出行),以衔接其出行“前(后)一公里”,满足居民“点到点”的出行需求[1-3]。共享单车以绿色环保的特点成为最友好的衔接方式,但只适合短距离换乘[4-6]。公交为居民市内长距离换乘提供选择[7],但公交是以固定路线和固定时间的补充服务,而非按需服务;且出租车、地铁等出行方式的运营都受到多种因素的影响,增加了公交接驳和乘客换乘全过程的耗时[8];同时不准确的公交车到站时间导致部分公交-地铁组合出行转向出租车-地铁组合出行[9]。当换乘距离较长时,出租车因其高效便捷,比公交可靠的特点更具优势[10-11]。为减少换乘耗时,出租车(网约车)接驳成为最主要的衔接方式[1]。此外,建成环境是出行的内在驱动因素,已有研究证明了出租车-地铁竞合出行与城市建成环境间存在依赖效应和尺度效应[12]。而地铁站点潜在影响区域(站域)是城市活动和地铁与其他交通方式衔接的关键,分析站域建成环境与站域内换乘出行的非线性关系,对以公交为导向发展(Transit-Oriented Development, TOD) 模式的可持续性具有非常关键的作用。由此,本文开展站域建成环境对出租车-地铁组合出行的影响研究,一方面揭示城市交通的协作性,为公交线网优化、定制公交[13]线路设计、站点布局等提供参考,以提高轨道交通的辐射吸引力;另一方面为TOD规划和实践提供理论支持和政策启示,促进城市公共交通与城市空间的协调发展。
目前,已有大量文献研究了建成环境对不同出行方式的影响。如:丁川[14]通过构建小汽车与建成环境间关系的分析框架,在考虑空间异质性基础上,揭示了建成环境对交通出行的内在影响机理;甘佐贤[15]采用多项Logistic模型探究了建成环境与站点客流间的关系,结果表明站点类型、站点周边土地利用类型和用地比例,以及到市中心距离对站点客流有显著的影响;Liu等[16]发现在土地利用混合程度高、道路交叉口密集、住宅区、商业区比例高的地区,出租车出行需求较高,而公交车站点较多的地区,出租车出行需求较低;Sabouri等[17]基于美国24个不同地区的数据,研究了建成环境对Uber出行需求的影响,结果表明Uber出行需求与交叉口密度和目的地可达性呈负相关。此类研究受到数据限制,仅讨论了建成环境对单一出行方式的影响。
近年来,有学者分析了建成环境与共享单车-地铁组合出行间的关系,发现离市中心近、土地利用混合度高、休闲娱乐用地比例高的地铁站点产生更多的共享单车-地铁组合出行[18-20]。然而,建成环境对出租车-地铁组合出行的影响研究较少[21]。Liu等[18]通过建立负二项回归模型,研究了上海市网约车-地铁和单车-地铁组合出行,研究结果表明网约车-地铁和单车-地铁组合出行分别集中在郊区和中心城区;陈启香等[12]采用多尺度地理加权回归模型探究了建成环境对出租车与地铁竞合关系的影响,结果表明建成环境对出租车与地铁竞合关系的影响具有空间异质性及尺度效应;Ni等[22]以无桩单车和出租车出行数据为基础,通过聚类方法和空间滞后模型,比较此2种出行方式作为“前(后)一公里”衔接方式的时空分布,结果表明无桩单车主要分布在房价较低、公交线路较少、信号交叉口较少的经济欠发达地区,在早高峰时段为接驳地铁,而房价高、主干路网发达的中心区人们更倾向于选择出租车,尤其是在晚高峰时段。上述研究在研究方法上多使用统计建模来探索建成环境与出行行为之间的关系,例如普通最小二乘模型、离散选择模型、地理加权回归模型。这些模型都假设了特定函数的先验假设,例如线性或对数线性关系,虽然具有直观的可解释性,但无法表达复杂的非线性关系,这可能导致建模偏差[23]。
一些学者尝试引入机器学习方法分析两者之间的非线性关系,以识别建成环境对出行的非线性影响。例如:刘畅等[24]使用随机森林模型分析了出行始发地、目的地和车外路段建成环境对公共交通与小汽车出行选择的影响,结果表明建成环境要素与交通方式选择间存在非线性关系且具有差异性;陈奕璠等[25]采用极限梯度提升(Extreme Gradient Boosting, XGBoost)模型从集计和非集计2个层面探究了共享单车使用特征与建成环境的依赖关系;Ding等[26]通过建立梯度增强决策树(Gradient Boosting Decision Tree, GBDT)模型研究了建成环境对地铁客流量的阈值和非线性影响,并得到各影响因素的阈值效应;Tu等[27-28]利用GBDT模型识别网约车订单起始点的建成环境特征,并通过依赖图来表征网约车服务与关键建成环境要素之间的非线性关系。尽管上述研究通过机器学习模型证实了建成环境与出行之间的非线性关系,但并未探究站域建成环境与组合出行之间的非线性关系。地铁站点潜在影响区域是城市建成环境开发利用的重要节点[15],掌握站域内组合出行与站域建成环境间的关系,对优化城市交通结构、制定有针对性的土地利用干预措施和改善公共交通可达性等具有重要意义。综上所述,本文基于兰州市出租车轨迹数据,根据地铁站点的直接影响范围和出租车地铁竞合出行关系,识别出租车-地铁组合出行;基于兰州市建成环境数据,划定轨道交通站点潜在影响范围,获取站域的建成环境数据;采用机器学习模型分析站域的建成环境对地铁运营时段内出租车-地铁组合出行的非线性影响特征:重要性、方向及阈值现象。
1. 研究区域与数据来源
1.1 研究区域
本文的研究区域包括兰州市城关区、安宁区和七里河区,如图 1所示。一河两岸、各城区发展不均衡等特点,导致兰州市居民出行效率不高。公交、出租车和地铁是主要的公共交通方式。由于气候、地形、道路网等原因,共享单车并未成为兰州地铁的主要衔接方式。兰州公交也面临许多问题,如准点率低、线路不合理、部分片区公交车次少、发车时间间隔长等。兰州地铁1号线全长约26 km,设车站20座,贯穿兰州主城区东西走向(如图 1中的车站)。本文将研究区域划分为1 km×1 km大小的不相交的正方形网格作为基本研究单元,如图 2所示。
1.2 出租车轨迹数据
1.2.1 出租车轨迹数据预处理
本文选取2021年4月1~26日的出租车轨迹数据,如表 1所示。并对出租车轨迹数据清洗:删除无关字段,仅保留字段“车牌号”“时间”“经度”“纬度”“载客状态”等字段;删除速度大于120 km·h-1、超出兰州市地理边界的数据记录;利用Pandas的Duplicates函数处理重复数据;计算轨迹点间的欧式距离,筛除距离变化很小的点;识别停运车辆,删除该车当天的数据。从清洗过的出租车轨迹数据集中识别上下客点;提取载客轨迹;建立出租车行程数据集。
表 1 出租车轨迹数据格式Table 1. Data format of taxi trajectory字段 数据类型 实例 备注 车牌号 文本 甘AXXXX 出租车的唯一标识 时间 20210402083526 2021年4月2日08:35:26 载客状态 空车 空载状态 方向角 正北 正北方向 经度 数字 36.30 单位为° 纬度 103.78 单位为° 瞬时速度 35 单位为km·h-1 里程数 100 单位为km 1.2.2 识别出租车-地铁组合出行
根据出租车某次行程是否可以由地铁实现、是否延伸地铁出行、是否服务于地铁路线无法到达的区域,将出租车行程分为3类:与地铁竞争、延伸地铁和补充地铁。其中,延伸地铁出行的55%[29]为出租车-地铁组合出行,并将其细分为:①地铁站到目的地的接出出行,即接出出行的起点O在缓冲区内,延伸目的地D;②出发点到地铁站的接入出行,D点在缓冲区内,延伸O点。
本文根据地铁站点的直接影响范围,以步行尺度作为计算指标[30]构建地铁站缓冲区。Sun等[31]提出可接受的步行距离在0.4~0.8 km。本文选取0.5 km作为半径,创建地铁站缓冲区。然后以图 3所示方法对2021年4月1~26日地铁运营时段内的61.9万次出租车行程分类识别,其中4.26%为与地铁竞争型,37.47%为延伸地铁型,58.73%为补充地铁型,说明在地铁网络不发达的兰州市仍有较多的出行需求无法由地铁实现。
1.3 建成环境数据
1.3.1 站点潜在影响范围确定
站点潜在影响范围是指乘客通过地铁换乘共享单车、公交车或出租车时,从地铁站出发或到达地铁站后所能覆盖的城市空间的广度和深度[30]。站点潜在影响范围是以地铁站点为圆心,以乘客通过其他交通方式换乘到该地铁站点的空间距离为半径所构成的圆形范围[32]。当换乘距离确定后,就可以划定站点的潜在影响范围[33]。换乘距离视为接驳距离累积分布的第85个百分位数[6],既能涵盖大多数乘客出入地铁站的接驳距离。Lee等[34]最早使用二次回归和三次回归获得第85百分位值,分别为
yd1=α0+α1d1+α2d21 (1) yd2=β0+β1d1+β2d21+β3d31 (2) 式中:yd1、yd2分别为二次回归和三次回归获得的第85百分位值;d1为接驳距离;α0、α1、α2均为二次回归的系数;β0、β1、β2、β3均为三次回归的系数。
本文使用二次回归模型解释出租车-地铁组合出行距离分布,表 2为接入出行、接出出行换乘距离计算结果,R2和Sig为模型的拟合优度和显著性水平,R2越接近1表示拟合程度越高,Sig越小,表示统计显著性越高。表 2所示所有结果都具有统计显著性,且由表 2可知:早高峰接入出行距离大于接出出行,而晚高峰期间刚好相反,表明居民出行具有对称性;早晚高峰期间换乘距离为3.7~4.1 km,表明出租车-地铁组合出行有可能转为自行车-地铁或公交-地铁组合出行。综上,本文选取3.8 km为半径划定地铁站潜在影响范围。
表 2 接入出行、接出出行换乘距离计算结果Table 2. Calculation results of transfer distance for access and egress trips类型 方式 时段 回归模型 R2 Sig 换乘距离/m 工作日 接入出行 早高峰 y=-0.005 4+2.777×10-4x1-1.392×10-8x12 0.997 0.000 3 847 晚高峰 y=-0.006 6+2.782×10-4x1-1.389×10-8x12 0.998 0.000 3 830 接出出行 早高峰 y=-0.001 8+2.751×10-4x2-1.365×10-8x22 0.997 0.000 3 796 晚高峰 y=-0.003+2.804×10-4x2-1.385×10-8x22 0.997 0.000 3 957 节假日 接入出行 早高峰 y=-0.047 2+2.849×10-4x1-1.418×10-8x12 0.998 0.000 3 910 晚高峰 y=-0.002 6+2.774×10-4x1-1.403×10-8x12 0.999 0.000 3 775 接出出行 早高峰 y=-0.066+3.088×10-4x2-1.566×10-8x22 0.998 0.000 3 794 晚高峰 y=-0.545×10-4x2-1.132×10-8x22 0.998 0.000 4 080 1.3.2 站域建成环境数据统计
建成环境涵盖了密度、混合度、设计、公共交通邻近性、目的地可达性的要素,每一类要素涵盖众多的评价指标[15]。遵循数据可获取性、科学性、系统性等原则[35],本文选取表 3中所示评价指标作为自变量。
表 3 建成环境评价指标Table 3. Evaluation indicators of built environment特征因子 特征指标 分析尺度 数据来源 密度 不同类型土地利用的密度 1 km×1 km 政府规划 多样性 土地利用混合度 1 km×1 km 根据土地利用类型数据计算 设计 路网密度 1 km×1 km 开放街道地图 公共交通邻近性 公交站点/线网密度 1 km×1 km 百度地图 采用熵指数法计算各网格的土地利用混合度[29],即
Ei=−∑jpijln(pij)ln(Ni) (3) 式中:Ei为网格i中的土地利用混合度,其值在[0, 1] 之间,0表示网格内只有一种土地利用,1表示网格内各土地利用比例相等;pij为网格i中j类用地所占比例;Ni为网格i中土地利用类型的数量。
站域建成环境是指与接驳过程相关的建成环境,包括了起点/终点、地铁站点以及接驳出行的路线[36],如图 4所示。借助Arc GIS系统,以3.8 km为半径得到每个站的潜在影响区域,划定站域范围;利用1 km×1 km的网格切割站域范围;将土地利用数据、路网数据、公交站点及线路以Shapefile文件的形式导入Arc GIS系统;运用Arc Tool Box中的相交、空间连接等方法完成每个网格内土地利用类型、公交站点、公交线路及路网密度等建成环境指标数据的统计,如表 4所示。
表 4 变量描述与统计Table 4. Variable descriptions and statistics变量类型 变量 描述 最小值 最大值 均值 标准差 因变量 Na1 每个网格内工作日早高峰时段接入出行量/人次 0 521 40.604 62.849 Ne1 每个网格内工作日晚高峰时段接入出行量/人次 0 364 31.022 47.775 Na2 每个网格内工作日早高峰时段接出出行量/人次 0 393 31.483 51.274 Ne2 每个网格内工作日晚高峰时段接出出行量/人次 0 404 39.135 54.606 自变量 E 每个网格内的土地利用混合度 0 0.444 0.183 0.108 PRT 每个网格内居住用地密度/(m2·km-2) 0 0.946 0.209 0.212 PC 每个网格内商业用地密度/(m2·km-2) 0 0.389 0.027 0.058 PI 每个网格内工业用地密度/(m2·km-2) 0 0.969 0.084 0.166 PRN 每个网格内休闲用地密度/(m2·km-2) 0 0.464 0.020 0.054 PO 每个网格内其他用地密度/(m2·km-2) 0 0.568 0.036 0.089 PRD 每个网格内路网密度/(km·km-2) 0 25.416 9.298 5.296 PBS 每个网格内公交站点密度/(个·km-2) 0 115.000 15.163 20.650 PBL 每个网格内公交线路密度/(km·km-2) 0 86.416 10.290 14.046 2. 研究方法
2.1 极限梯度提升模型
XGBoost是一种基于梯度提升决策树的新型集成机器学习算法[37]。XGBoost在每次迭代中构建一棵新树,以拟合当前预测值与目标值的残差,最后对所有树的输出结果进行求和,作为最终的预测值。XGBoost的目标函数L由两部分组成,即损失函数和正则项,正则项的加入能够控制模型复杂度,使得模型更加简单,有利于防止过拟合,L为
L=N∑n=1l(yn,ˆyn)+∑kΩ(fk) (4) Ω(fk)=γT+12λ||w||2 (5) 式中:l(yn, ŷn)为衡量第n个样本观测值yn和预测值ŷn之间的差异损失函数;N为样本总量;Ω(fk)为第k棵树fk的正则项;γ为每片叶子的复杂度参数;T为叶子的数量;λ为惩罚参数;w为叶子权重[38]。
2.2 SHAP(Shapley Additive Explanations,SHAP)模型
SHAP模型由Shapley基于博弈理论于1953年提出,模型衡量了变量的重要性并将其可视化。SHAP计算每个特征对目标预测的贡献,实现对目标实例预测的解释。利用合作博弈理论计算SHAP值评估模型中特征值的贡献[39]。在合作博弈论中,SHAP值的计算方法为[40]
φm=∑S⊆F{m}|S|!(F−|S|−1)!F!·[fS∪{m}(x′S∪{m})−fS(x′S)] (6) 式中:φm为特征m的归因值,即SHAP值;S为纳入模型的特征子集;F为所有特征的集合;x′S∪{m}为集合S中除了特征m的特征值;x′S为集合S中的特征值;fS∪{m}(·)为样本特征值在S∪{m}区间时的预测值;fS(·)为样本特征值在集合S中的预测值。
在此基础上定义了线性函数特征归因方法,即
g(x′)=φ0+M∑m=1φmx′m (7) 式中:g(x′)为样本x′所解释的模型;φ0为当输入变量为0时模型的基础值,是常数;M为输入特征的数量;x′m为第m个特征样本。
SHAP值反映每一个样本中特征的贡献度(特征重要性),若值为正,则为正向作用,意味着该特征对预测有正向、积极作用,负的SHAP值则相反。
2.3 必要条件分析法
Dul等[41]提出了必要条件分析(Necessary Condition Analysis, NCA)方法,该方法可以检验结果产生的必要条件。必要条件的影响通过上限区域对结果的约束来表示。上限区域(图 5中的空白区域)面积越大,上限包络线越低,必要条件的影响越强。
3. 试验结果分析
3.1 影响因素非线性建模
本文借助Python的Scikit-Learn库构建XGBoost模型来解释站域建成环境与早晚高峰时段接入出行、接出出行的非线性关系。采用Scikit-Learn中网格搜索的内部交叉验证方法选择最佳的参数以获得稳定的模型结果。将80%的接入出行量、接出出行量用于模型训练,剩余的20%用于模型验证,模型的R2如表 5所示,可知:晚高峰拟合效果总体优于早高峰,表明模型能更好捕捉晚高峰出行的变化。由于XGBoost模型无法进行显着性检验或得出系数的置信区间,因此,使用SHAP模型解释XGBoost模型的结果,分析站域建成环境如何影响接入出行、接出出行。最后采用NCA方法探索站域建成环境对接入出行、接出出行的必要性。
表 5 XGBoost模型拟合优度Table 5. Goodness of fit of XGBoost model变量 R2 训练集 验证集 接入出行 早高峰 0.79 0.60 晚高峰 0.75 0.64 接出出行 早高峰 0.74 0.59 晚高峰 0.78 0.69 3.2 影响因素重要性分析
通过SHAP模型得到站域建成环境要素重要性的SHAP值和SHAP概要图,如图 6~9所示。图 6(b)~9(b)中的点表示建成环境要素在一个预测样本中的SHAP值,即建成环境要素对出租车-地铁组合出行的贡献度;点的颜色表示建成环境要素的大小,从蓝色到红色表示建成环境要素数值从低到高。
由图 6(a)~9(a)可知:大部分建成环境要素对出租车-地铁组合出行的贡献不是单纯的正向作用或负向作用,而是随着相应建成环境要素的变化而变化,且重要性越大的建成环境要素变化越明显;对出租车-地铁组合出行贡献度最大的建成环境要素依次为居住用地密度、公交站点密度和路网密度,且为正向作用。这是由于居住地密集、公交站点较多的区域,总出行需求多。这一结果说明早晚高峰期间的出租车-地铁组合出行多为通勤、通学出行,且验证了早晚高峰期间一部分的公交-地铁组合出行转为出租车-地铁组合出行。
由图 6(b)~9(b)可知:土地利用混合度红色样本点的SHAP值为负,表明当站点潜在影响范围内的土地利用混合度越高时,将会减少出租车-地铁的组合出行量;商业用地密度对早高峰时段的出租车-地铁组合出行呈显著负相关影响,这说明早高峰期间很少有人通过出租车-地铁组合出行到周边地区购物、娱乐等,进而减少了地铁站和商业街之间的短途行程,抑制了出租车-地铁组合出行。
3.3 必要性分析和非线性分析
NCA结果如图 10~13所示。图 10~13可知:站域建成环境要素和出租车-地铁组合出行间的必要但不充分的关系生成了散点图,且存在明显的空间不包含或包含较少的数据点,表明相应的建成环境要素限制了被解释的出行的可能水平;土地利用混合度、公交站点密度、路网密度、居住用地密度是出租车-地铁组合出行间的必要条件;路网密度的上限区域最大,即必要性效应最大,其影响最强;土地利用混合度的必要性效应最小;商业用地密度和休闲用地密度未呈现出明显的必要性效应。
对于早、晚高峰时段的接入出行,表 6列出了站域建成环境要素的重要性以及充分性和必要性检验的结果,其中加粗数值表示具有显著性,即p < 0.01。由表 6可知:早高峰期间充分条件下影响接入出行最重要的建成环境要素依次是公交站点密度、居住用地密度和路网密度等;晚高峰期间充分条件下影响接入出行最重要的建成环境要素依次是居住用地密度、路网密度和公交站点密度等;公交站点密度、居住用地密度和路网密度对早、晚高峰期间的接入出行呈现出显著的充分必要性影响。
表 6 站域建成环境要素的充分性和必要性(接入出行)Table 6. Sufficiency and necessity of feeder-related built environment elements (access trips)变量 早高峰接入出行 是否充分必要?(早高峰) 晚高峰接入出行 是否充分必要?(晚高峰) 充分性/% 必要性 充分性/% 必要性 E 9.74 0.164 否 13.47 0.120 否 PBS 33.38 0.398 是 23.13 0.346 是 PRD 19.33 0.589 是 23.84 0.576 是 PC 7.43 0.004 否 5.42 0.004 否 PI 0.00 0.000 否 0 0.000 否 PRT 30.10 0.295 是 34.13 0.363 是 PRN 0.00 0.005 否 0.00 0.004 否 PO 0.00 0.000 否 0.00 0.000 否 对于早、晚高峰期间的接出出行,表 7列出了变量的重要性以及充分性和必要性检验的结果,其中加粗数值表示具有显著性,即p < 0.01。由表 7可知:早高峰期间充分条件下影响接出出行最重要的建成环境要素依次是公交站点密度、居住用地密度和路网密度等;晚高峰期间充分条件下影响接出出行最重要的建成环境要素分别是居住用地密度、公交站点密度和土地利用混合度等;公交站点密度、居住用地密度和路网密度对早、晚高峰期间的接出出行呈现出显著的充分必要性影响。
表 7 站域建成环境要素的其充分性和必要性(接出出行)Table 7. Sufficiency and necessity of feeder-related built environment elements (egress trips)变量 早高峰接出出行 是否充分必要?(早高峰) 晚高峰接出出行 是否充分必要?(晚高峰) 充分性/% 必要性 充分性/% 必要性 E 7.30 0.167 否 14.72 0.103 否 PBS 41.48 0.352 是 20.32 0.343 是 PRD 14.41 0.574 是 14.58 0.561 是 PC 5.94 0.657 否 3.36 0.004 否 PI 12.10 0.000 否 4.44 0.000 否 PRT 15.61 0.434 是 40.88 0.380 是 PRN 3.15 0.005 否 1.69 0.005 否 PO 0.00 0.000 否 0.00 0.000 否 图 10~13和表 6、7的结果表明建成环境要素对不同类型的出租车地铁组合出行具有不同的贡献和影响,造成这种差异的可能原因是不同类型的出租车-地铁组合出行的出行目的不同,同时也验证了本文对不同类型出租车-地铁组合出行分别建模的必要性。
绘制了贡献率前5的站域建成环境要素的SHAP依赖关系图,如图 14~17所示,可知:随着土地利用混合度、公交站点密度、路网密度等建成环境要素值的增长,对出租车-地铁组合出行的贡献大部分是单调变化的,且都存在某个阈值使得贡献发生正负的转变。具体结论如下。
(1) 地铁站潜在影响范围内的公交站点数量对出租车-地铁组合出行呈现较为显著的非线性特征。随着网格内公交站点数量的增加,公交站点密度的贡献(SHAP值)呈现3个阶段的上升趋势。SHAP值为负时是第1阶段,从第1阶段到第2阶段公交站点密度对出租车-地铁组合出行的贡献由负向转为正向,分界点处的公交站点密度为15个·km-2。第2、3阶段的分界点在50个·km-2处,当公交站点密度大于50个·km-2,其对出租车-地铁组合出行的正向贡献进一步增大。
(2) 地铁站潜在影响范围内的路网密度对出租车-地铁组合出行呈现较为显著的非线性特征,其SHAP值与其自身也拥有明显的正相关关系。在路网密度较低的区域SHAP值保持在接近0的稳定的负值,路网密度在14 km·km-2处由负向贡献转向正向贡献,在路网密度大于14 km·km-2的网格中,道路网密度对出租车-地铁组合出行都有正向贡献且增长十分迅速。
(3) 地铁站潜在影响范围内的居住用地密度对出租车-地铁组合出行呈现较为显著的非线性特征。随着居住用地密度的增加,居住用地密度对出租车-地铁组合出行的贡献(SHAP值)呈现3个阶段变化,第1阶段到第2阶段是居住用地密度对出租车-地铁组合出行的贡献由负向转为正向,分界点处的居住用地密度为0.2 m2·km-2。第2、3阶段的分界点在0.45 m2·km-2处,居住用地密度大于0.45 m2·km-2,其对出租车-地铁组合出行的正向贡献趋于稳定。
(4) 对于商业用地密度,其在大部分的样本中贡献都接近0,只有少部分样本中对出租车-地铁组合出行有正向的贡献。
4. 结语
(1) 通过二次回归模型得到接入出行、接出出行平均距离为3.8 km,以3.8 km为半径划定站点潜在影响范围。同时发现高峰时段出租车-地铁组合出行的换乘距离在3.7~4.0 km,相较于与单车-地铁组合出行的换乘距离(小于3 km)并不算长,因此,出租车-地铁组合出行向自行车-地铁或公交-地铁组合出行转变具有很大的潜力。
(2) 非线性影响分析结果表明,公交站点密度、路网密度、居住用地密度对出租车-地铁组合出行具有显著的充分性和必要性。随着1 km×1 km网格内公交站点数量增加,公交站点密度的SHAP值呈现3个阶段变化;居住用地密度超过阈值0.45 m2·km-2时,其对出租车-地铁组合出行的正向贡献趋于平衡;路网密度大于14 km·km-2时促进出租车-地铁组合出行。
(3) 组合出行需求还与就业密度、人口密度、地铁客流量等相关,需在未来的研究中进行分析;本文以兰州市为例展开研究,由于其他城市的功能布局、出行结构和公共交通发展程度等方面与兰州市存在一定的差异,因此,本文的一些研究结论并不能直接应用在其他城市,未来可针对其他城市开展相关研究。
-
表 1 出租车轨迹数据格式
Table 1. Data format of taxi trajectory
字段 数据类型 实例 备注 车牌号 文本 甘AXXXX 出租车的唯一标识 时间 20210402083526 2021年4月2日08:35:26 载客状态 空车 空载状态 方向角 正北 正北方向 经度 数字 36.30 单位为° 纬度 103.78 单位为° 瞬时速度 35 单位为km·h-1 里程数 100 单位为km 表 2 接入出行、接出出行换乘距离计算结果
Table 2. Calculation results of transfer distance for access and egress trips
类型 方式 时段 回归模型 R2 Sig 换乘距离/m 工作日 接入出行 早高峰 y=-0.005 4+2.777×10-4x1-1.392×10-8x12 0.997 0.000 3 847 晚高峰 y=-0.006 6+2.782×10-4x1-1.389×10-8x12 0.998 0.000 3 830 接出出行 早高峰 y=-0.001 8+2.751×10-4x2-1.365×10-8x22 0.997 0.000 3 796 晚高峰 y=-0.003+2.804×10-4x2-1.385×10-8x22 0.997 0.000 3 957 节假日 接入出行 早高峰 y=-0.047 2+2.849×10-4x1-1.418×10-8x12 0.998 0.000 3 910 晚高峰 y=-0.002 6+2.774×10-4x1-1.403×10-8x12 0.999 0.000 3 775 接出出行 早高峰 y=-0.066+3.088×10-4x2-1.566×10-8x22 0.998 0.000 3 794 晚高峰 y=-0.545×10-4x2-1.132×10-8x22 0.998 0.000 4 080 表 3 建成环境评价指标
Table 3. Evaluation indicators of built environment
特征因子 特征指标 分析尺度 数据来源 密度 不同类型土地利用的密度 1 km×1 km 政府规划 多样性 土地利用混合度 1 km×1 km 根据土地利用类型数据计算 设计 路网密度 1 km×1 km 开放街道地图 公共交通邻近性 公交站点/线网密度 1 km×1 km 百度地图 表 4 变量描述与统计
Table 4. Variable descriptions and statistics
变量类型 变量 描述 最小值 最大值 均值 标准差 因变量 Na1 每个网格内工作日早高峰时段接入出行量/人次 0 521 40.604 62.849 Ne1 每个网格内工作日晚高峰时段接入出行量/人次 0 364 31.022 47.775 Na2 每个网格内工作日早高峰时段接出出行量/人次 0 393 31.483 51.274 Ne2 每个网格内工作日晚高峰时段接出出行量/人次 0 404 39.135 54.606 自变量 E 每个网格内的土地利用混合度 0 0.444 0.183 0.108 PRT 每个网格内居住用地密度/(m2·km-2) 0 0.946 0.209 0.212 PC 每个网格内商业用地密度/(m2·km-2) 0 0.389 0.027 0.058 PI 每个网格内工业用地密度/(m2·km-2) 0 0.969 0.084 0.166 PRN 每个网格内休闲用地密度/(m2·km-2) 0 0.464 0.020 0.054 PO 每个网格内其他用地密度/(m2·km-2) 0 0.568 0.036 0.089 PRD 每个网格内路网密度/(km·km-2) 0 25.416 9.298 5.296 PBS 每个网格内公交站点密度/(个·km-2) 0 115.000 15.163 20.650 PBL 每个网格内公交线路密度/(km·km-2) 0 86.416 10.290 14.046 表 5 XGBoost模型拟合优度
Table 5. Goodness of fit of XGBoost model
变量 R2 训练集 验证集 接入出行 早高峰 0.79 0.60 晚高峰 0.75 0.64 接出出行 早高峰 0.74 0.59 晚高峰 0.78 0.69 表 6 站域建成环境要素的充分性和必要性(接入出行)
Table 6. Sufficiency and necessity of feeder-related built environment elements (access trips)
变量 早高峰接入出行 是否充分必要?(早高峰) 晚高峰接入出行 是否充分必要?(晚高峰) 充分性/% 必要性 充分性/% 必要性 E 9.74 0.164 否 13.47 0.120 否 PBS 33.38 0.398 是 23.13 0.346 是 PRD 19.33 0.589 是 23.84 0.576 是 PC 7.43 0.004 否 5.42 0.004 否 PI 0.00 0.000 否 0 0.000 否 PRT 30.10 0.295 是 34.13 0.363 是 PRN 0.00 0.005 否 0.00 0.004 否 PO 0.00 0.000 否 0.00 0.000 否 表 7 站域建成环境要素的其充分性和必要性(接出出行)
Table 7. Sufficiency and necessity of feeder-related built environment elements (egress trips)
变量 早高峰接出出行 是否充分必要?(早高峰) 晚高峰接出出行 是否充分必要?(晚高峰) 充分性/% 必要性 充分性/% 必要性 E 7.30 0.167 否 14.72 0.103 否 PBS 41.48 0.352 是 20.32 0.343 是 PRD 14.41 0.574 是 14.58 0.561 是 PC 5.94 0.657 否 3.36 0.004 否 PI 12.10 0.000 否 4.44 0.000 否 PRT 15.61 0.434 是 40.88 0.380 是 PRN 3.15 0.005 否 1.69 0.005 否 PO 0.00 0.000 否 0.00 0.000 否 -
[1] JIN Tan-hua, CHENG Long, ZHANG Xu-cai, et al. Nonlinear effects of the built environment on metro-integrated ridesourcing usage[J]. Transportation Research Part D: Transport and Environment, 2022, 110: 103426. doi: 10.1016/j.trd.2022.103426 [2] AZIMI G, RAHIMI A, LEE M, et al. Mode choice behavior for access and egress connection to transit services[J]. International Journal of Transportation Science and Technology, 2021, 10(2): 136-155. doi: 10.1016/j.ijtst.2020.11.004 [3] WELCH T F, GEHRKE S R, WIDITA A. Shared-use mobility competition: a trip-level analysis of taxi, bikeshare, and transit mode choice in Washington DC[J]. Transportmetrica A: Transport Science, 2020, 16(1): 43-55. doi: 10.1080/23249935.2018.1523250 [4] ZHAO Peng-jun, LI Sheng-xiao. Bicycle-metro integration in a growing city: the determinants of cycling as a transfer mode in metro station areas in Beijing[J]. Transportation Research Part A: Policy and Practice, 2017, 99: 46-60. doi: 10.1016/j.tra.2017.03.003 [5] FAN Yi-chuan, ZHENG Si-qi. Dockless bike sharing alleviates road congestion by complementing subway travel: evidence from Beijing[J]. Cities, 2020, 107: 102895. doi: 10.1016/j.cities.2020.102895 [6] WANG Jue-yu, CAO Xin-yu. Exploring built environment correlates of walking distance of transit egress in the Twin Cities[J]. Journal of Transport Geography, 2017, 64: 132-138. doi: 10.1016/j.jtrangeo.2017.08.013 [7] AZIZ A, NAWAZ M, NADEEM M S, et al. Examining suitability of the integrated public transport system: a case study of Lahore[J]. Transportation Research Part A: Policy and Practice, 2018, 117: 13-25. doi: 10.1016/j.tra.2018.08.003 [8] ZHANG Xiao-hu, XU Yang, TU Wei, et al. Do different datasets tell the same story about urban mobility—a comparative study of public transit and taxi usage[J]. Journal of Transport Geography, 2018, 70: 78-90. doi: 10.1016/j.jtrangeo.2018.05.002 [9] YANG Min, ZHAO Jing-yao, WANG Wei, et al. Metro commuters' satisfaction in multi-type access and egress transferring groups[J]. Transportation Research Part D: Transport and Environment, 2015, 34: 179-194. doi: 10.1016/j.trd.2014.11.004 [10] YANG L C, CHAU K W, SZETO W Y, et al. Accessibility to transit, by transit, and property prices: spatially varying relationships[J]. Transportation Research Part D: Transport and Environment, 2020, 85: 102387. doi: 10.1016/j.trd.2020.102387 [11] ZGHEIB N, ABOU-ZEID M, KAYSI I. Modeling demand for ridesourcing as feeder for high capacity mass transit systems with an application to the planned Beirut BRT[J]. Transportation Research Part A: Policy and Practice, 2020, 138: 70-91. doi: 10.1016/j.tra.2020.05.019 [12] 陈启香, 吕斌, 陈喜群, 等. 空间异质性建成环境对出租车与地铁竞合关系的影响[J]. 交通运输系统工程与信息, 2022, 22(3): 25-35.CHEN Qi-xiang, LYU Bin, CHEN Xi-qun, et al. Impacts of built environment on competition and cooperation relationship between taxi and subway considering spatial heterogeneity[J]. Journal of Transportation Systems Engineering and Information Technology, 2022, 22(3): 25-35. (in Chinese) [13] 周瑾. 基于轨道交通车站的巡游定制公交线路效率与配置研究[D]. 北京: 北京交通大学, 2023.ZHOU Jin. Research on line efficiency and configuration of cruise customized bus based on rail transit station[D]. Beijing: Beijing Jiaotong University, 2023. (in Chinese) [14] 丁川. 考虑空间异质性的城市建成环境对交通出行的影响研究[D]. 深圳: 哈尔滨工业大学(深圳), 2014.DING Chuan. Research on impacts of urban built environment on travel accounting for spatial heterogeneity[D]. Shenzhen: Harbin Institute of University, Shenzhen, 2014. (in Chinese) [15] 甘佐贤. 建成环境对城市轨道交通客流及出行特征的影响机理研究[D]. 南京: 东南大学, 2019.GAN Zuo-xian. Impact of built environment on the passenger flows and transfer behavior of urban rail transit[D]. Nanjing: Southeast University, 2019. (in Chinese) [16] LIU Qian, DING Chuan, CHEN Peng. A panel analysis of the effect of the urban environment on the spatiotemporal pattern of taxi demand[J]. Travel Behaviour and Society, 2020, 18: 29-36. doi: 10.1016/j.tbs.2019.09.003 [17] SABOURI S, PARK K, SMITH A, et al. Exploring the influence of built environment on Uber demand[J]. Transportation Research Part D: Transport and Environment, 2020, 81: 102296. doi: 10.1016/j.trd.2020.102296 [18] LIU Xing-hua, FAN Jing, LI Ye, et al. Analysis of integrated uses of dockless bike sharing and ridesourcing with metros: a case study of Shanghai, China[J]. Sustainable Cities and Society, 2022, 82: 103918. doi: 10.1016/j.scs.2022.103918 [19] GUO Y Y, HE S Y. Built environment effects on the integration of dockless bike-sharing and the metro[J]. Transportation Research Part D: Transport and Environment, 2020, 83: 102335. doi: 10.1016/j.trd.2020.102335 [20] GUO Y Y, HE S Y. The role of objective and perceived built environments in affecting dockless bike-sharing as a feeder mode choice of metro commuting[J]. Transportation Research Part A: Policy and Practice, 2021, 149: 377-396. doi: 10.1016/j.tra.2021.04.008 [21] MA Qing-yu, XIN Yan-an, YANG Hong, et al. Connecting metros with shared electric scooters: comparisons with shared bikes and taxis[J]. Transportation Research Part D: Transport and Environment, 2022, 109: 103376. doi: 10.1016/j.trd.2022.103376 [22] NI Ying, CHEN Jia-qi. Exploring the effects of the built environment on two transfer modes for metros: dockless bike sharing and taxis[J]. Sustainability, 2020, 12(5): 2034-2054. doi: 10.3390/su12052034 [23] 王建军, 王赛, 宋明洋, 等. 大数据背景下城市建成环境对出行行为影响研究综述[J]. 长安大学学报(自然科学版), 2022, 42(1): 61-78.WANG Jian-jun, WANG Sai, SONG Ming-yang, et al. Review of research on impact of urban built environment on travel behavior in big data context[J]. Journal of Chang'an University (Natural Science Edition), 2022, 42(1): 61-78. (in Chinese) [24] 刘畅, 郭亮, 杨朔, 等. 建成环境对公共交通与小汽车出行方式选择的非线性影响——基于出行链视角[J]. 热带地理, 2024, 44(5): 891-905.LIU Chang, GUO Liang, YANG Shuo, et al. Nonlinear effects of the built environment on public transit and private vehicle model choice: a trip chain perspective[J]. Tropical Geography, 2024, 44(5): 891-905. (in Chinese) [25] 陈奕璠, 张步镐, 党振, 等. 建成环境对共享单车使用特征的非线性影响研究[J]. 交通运输系统工程与信息, 2024, 24(2): 217-224.CHEN Yi-fan, ZHANG Bu-hao, DANG Zhen, et al. Exploring nonlinear effects of built environment on dockless bike sharing usage[J]. Journal of Transportation Systems Engineering and Information Technology, 2024, 24(2): 217-224. (in Chinese) [26] DING Chuan, CAO Xin-yu, LIU Cao. How does the station-area built environment influence metrorail ridership? Using gradient boosting decision trees to identify non-linear thresholds[J]. Journal of Transport Geography, 2019, 77: 70-78. doi: 10.1016/j.jtrangeo.2019.04.011 [27] TU Mei-ting, LI Wen-Xiang, ORFILA O, et al. Exploring nonlinear effects of the built environment on ridesplitting: evidence from Chengdu[J]. Transportation Research Part D: Transport and Environment, 2021, 93: 102776. doi: 10.1016/j.trd.2021.102776 [28] LYU Tao, WANG Pei-rong, GAO Ya-nan, et al. Research on the big data of traditional taxi and online car-hailing: a systematic review[J]. Journal of Traffic and Transportation Engineering (English Edition), 2021, 8(1): 1-34. doi: 10.1016/j.jtte.2021.01.001 [29] 陈启香. 基于建成环境的出租车与地铁竞合机理研究[D]. 兰州: 兰州交通大学, 2023.CHEN Qi-xiang. Research on the coopetition mechanism between taxi and subway based on the built environment[D]. Lanzhou: Lanzhou Jiaotong University, 2023. (in Chinese) [30] 佟欣. 轨道站域空间组织对步行服务效率的影响研究——以深圳市典型站域为例[D]. 深圳: 哈尔滨工业大学(深圳), 2020.TONG Xin. Research on impacts of spatial organization of railway station area on walking service efficiency: a case study of Shenzhen[D]. Shenzhen: Harbin Institute of University, Shenzhen, 2020. (in Chinese) [31] SUN Jian, PENG Zhong-ren, CHEN Wei-ya, et al. Development of web-based transit trip-planning system based on service-oriented architecture[J]. Transportation Research Record, 2011, 2217(1): 87-94. doi: 10.3141/2217-11 [32] 王淑伟, 孙立山, 荣建. 北京市轨道站点吸引范围研究[J]. 交通运输系统工程与信息, 2013, 13(3): 183-188.WANG Shu-wei, SUN Li-shan, RONG Jian. Catchment area analysis of Beijing transit stations[J]. Journal of Transportation Systems Engineering and Information Technology, 2013, 13(3): 183-188. (in Chinese) [33] WANG Zi-jia, CHEN Feng, XU Tian-kun. Interchange between metro and other modes: access distance and catchment area[J]. Journal of Urban Planning and Development, 2016, 142(4): 04016012. [34] LEE J, CHOI K, LEEM Y. Bicycle-based transit-oriented development as an alternative to overcome the criticisms of the conventional transit-oriented development[J]. International Journal of Sustainable Transportation, 2016, 10(10): 975-984. [35] 李甜. 考虑空间异质性的建成环境与交通系统运行状态关系建模及协调优化[D]. 镇江: 江苏大学, 2022.LI Tian. Research on the relationship model and coordination optimization between built environment and transportation state considering spatial heterogeneity[D]. Zhenjiang: Jiangsu University, 2022. (in Chinese) [36] GUO Yuan-yuan, YANG Lin-chuan, LU Yi, et al. Dockless bike-sharing as a feeder mode of metro commute? The role of the feeder-related built environment: analytical framework and empirical evidence[J]. Sustainable Cities and Society, 2021, 65: 102594. [37] CHEN Tian-qi, GUESTRIN C. XGBoost: a scalable tree boosting system[C]//ACM. 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2016: 785-794. [38] 谷岩岩. 大数据支持下的城市公共交通与土地利用互动研究[D]. 武汉: 武汉大学, 2020.GU Yan-yan. Research on interaction between urban public transportation and land use using big data[D]. Wuhan: Wuhan University, 2020. (in Chinese) [39] LUNDBERG S M, LEE S I. A unified approach to interpreting model predictions[J]. Advances in Neural Information Processing Systems, 2017, 2017: 4766-4775. [40] 吉淑娟. 建成环境对自行车使用和安全影响的异质性和非线性研究[D]. 西安: 长安大学, 2023.JI Shu-juan. Heterogeneous and non-linear effects of the built environment on bicycle use and bicycle safety[D]. Xi'an: Chang'an University, 2023. (in Chinese) [41] DUL J. Necessary condition analysis (NCA): logic and methodology of "necessary but not sufficient" causality[J]. Organizational Research Methods, 2016, 19(1): 10-52. -