为支持出租车营运评价和行业规划,科学掌握其营运现状与特点,以深圳市1个典型工作日为例,研究浮动车数据挖掘在出租车营运特征研究中的应用。依托对浮动车数据的特征解析,提出面向出租车营运挖掘分析的数据处理流程,针对空载率、运营速度、载客运营时长、出行需求的时空差异性等方面分析深圳市的出租车行业营运现状与特点。研究可为出租车营运评价提供新的视角,从对既有数据深度挖掘的角度提升行业的效益。
出租车是城市公共交通系统的重要组成部分之一,在树立城市形象、满足高层次出行需求等方面具有重大的意义。目前,中国的大城市普遍存在出租车空驶率高却又经常“打不到的”的现象,行业整体营运效率不高,亟需实时掌握出租车的时空营运特性,用以支持车辆调度、行业规划、政策研究等[1-2]。 常规的出租车运营数据采集方式包括人工调查和计价器,存在成本高、信息少、可靠性差、延时大等缺点。浮动车(Floating Car)是伴随着智能交通应用而发展起来的新型交通信息采集手段,它是指安装有GPS定位模块和无线通信模块的普通车辆,能实现较高精度的卫星定位并实时将位置信息传送到服务器数据中心。由于具备营运时间长、道路覆盖面广、便于集中管理等显著优点,出租车已成为国内外的浮动车典型。在国内,一般而言,浮动车数据(Floating Car Data, FCD)指的就是出租车GPS数据,因此除了用于对路网交通状态的感知之外,在对出租车本身的营运分析方面也具有极大的潜力[3]。相关研究方面,李道勇、康留旺、傅常伦等[4-6]仅从空驶率的角度分析深圳市出租车的运营特点,全面性不足;胡小文等[7]以100辆出租车的GPS数据为基础,分析出行需求空间分布、出行时长、出行距离等三项指标,但由于出租车的样本规模过小,难以准确反映实际整体运营状况;庄立坚、翁剑成、王刚等[8-11]对出租车的运营管理指标进行分类建模,分析空载率、速度、出行时长/距离等多项指标,但在出行需求角度未做深入挖掘探讨。 为支持营运评价和行业规划,科学掌握其运营现状与特点,以深圳市一个典型工作日为例,基于对浮动车数据的特征分析和处理挖掘,针对空载率、运营速度、载客运营时长、出行需求的时空差异性等方面进行分析,探讨浮动车数据挖掘在出租车营运评价中的应用。 研究以深圳市所有安装有车载GPS模块的出租车为研究对象,根据预设定,GPS模块会以一定的时间间隔向深圳市交委数据平台实时发送出租车当前的位置信息。服务器接收端实时接收回传的GPS数据,并以5分钟的间隔依次生成txt文本包,每天共生成288个包。如表1所示,浮动车数据的属性包括定位时间、车牌号码、公司代码、经纬度坐标、速度、方向、运营状态、数据可用性等。 ......2 浮动车数据处理
2.1 原始数据描述