论文部分内容阅读
随着车载GPS设备的大量安装和普遍使用,人们可以方便的获取海量车辆轨迹数据。这些轨迹数据集可潜在反映城市路网、人类出行行为以及城市交通动态等等,由此吸引了大量研究人员使用各种数据挖掘技术力求从这些数据中提取有价值的信息,为城市规划、智能交通、环境保护以及生物病毒传播遏制等领域实现许多创新应用。本文以私家车轨迹数据集为基础,研究了一种新的路网推理机制,据此挖掘和分析了个人出行模式、人群整体出行模式和城市间人群交互特征。
路网是导航、辅助驾驶以及自动驾驶技术必不可少的一部分。车辆的GPS轨迹可反映潜在的路网。从大量的车辆GPS轨迹中用软件自动推理路网使得地图的构建和更新速度大幅提升,花费大量减少。另外这种从大量轨迹中推理潜在路网的方式,使得推理出的路网本身就带有一些交通方面的信息,例如某路段在某些时段的拥堵程度、路口各方向上车辆的转弯概率等等。由于城市路网日益复杂,且城市级车辆轨迹数据集受到传输、存储成本的限制,导致轨迹采样率较低,为路网自动推理带来一定的挑战。本文尝试基于低采样率的私家车轨迹数据集,利用路网本身的特性和轨迹数据集的特征,提出了一种新的路网推理方法,能够有效提升复杂城市路网的推理精度。
在利用私家车GPS轨迹数据集构建城市路网的同时,私家车轨迹数据集也可以真实反映私家车主长期的出行活动。本文对大量私家车的长期轨迹数据进行分析,试图挖掘出个人出行模式以及对个人出行规律性进行量化度量。另外,本文也通过对大量私家车车主的活动轨迹进行整体分析,研究了群体出行行为特征,充分利用私家车轨迹数据包含的停等信息推理出人群的居住地、工作地和休闲地,并对人群在这三地的停留进行分析,以及统计每日出行次数分布、出行的单日模式特征等等。针对珠江三角洲5个城市的群体出行行为,分析比较了其出行距离和停留时长等分布的差异性特征。最后,对珠江三角洲5个城市之间的私家车出行趋向性进行了研究,通过城市间的私家车互达的车辆数目和活动数目两方面来体现城市间的人群移动性,潜在地反映城市之间的社会生活与经济活动的差异性与融合性。
本文以百度、高德公司的战略伙伴公司-深圳市麦谷科技有限公司提供的私家车轨迹数据集为基础展开研究,主要研究工作如下:
(1)城市日益复杂的路网使得从大量低采样率的GPS轨迹中推理路网变得非常困难,现有的大部分研究方法并不适合推理含复杂路口的路网。本文提出了一个可排除复杂路口GPS轨迹点干扰的路网推理简化方法-直接邻居路口检测算法,从而精确识别复杂路口的位置以及路口方向信息。该算法利用路口的方向信息,采用滑动窗口的方式抽取路段上的所有轨迹点,最终找到直接邻居路口并生成对应的路段信息。实验结果表明,本文构建的路网图与OpenStreetMap(一种众包形式的可编辑公开地图)相比,92.2%的路口位置误差在20米以内,91.6%的路段位置误差在8米以内。本文提出的路网推理算法在算法运行时间和识别精度上也明显优于几个经典路网推理算法,尤其是在复杂路口位置和方向的正确识别方面。
(2)私家车是城市道路车辆主体,其出行模式可以反映个人出行模式和移动规律性,其中如何描述个人移动特征是一个挑战。本文提出了一种基于私家车轨迹的个人移动规律性度量方法,可以方便检索出指定类型的规律性出行模式,也有利于作为量化指标来进行其它停留时间和目的地等的预测。本文首先从私家车轨迹中推理出可能的启停点,然后采用DBSCAN(Density Based Spatial Clustering of Applications with Noise)算法推理出个人的常访点,再利用Markov链来构建个人常访点之间的空时转换关系,最终设计适合私家车实际情况的熵率计算公式来度量个人移动的空时规律性。实验表明,其度量的规律性和视觉上的时空规律性非常一致,也比一般的主模式频率度量更加准确和全面。
(3)大量的个人出行行为可反映城市人群的整体移动性,私家车轨迹所特有的出行停等现象,可以从侧面反映城市整体的社会生活的运行模式。本文提出了一种基于DBSCAN聚类算法的私家车活动区域的识别算法,将私家车活动的区域有效地归为居住地、工作地和休闲地三类。本文首先利用前面推理出的路网来辅助剔除道路上的无效停等即堵车点,以提高对车辆活动的源和目的地提取的精度,然后对个人的有效停等点依据时空关系进行车辆活动区域的聚类识别。然后从整体上分析人群在居住地、工作地以及休闲地的停留时长和停留的开始以及结束时刻的分布。并统计人们的每日出行次数、出行距离以及出行的每日模式分布。然后对珠江三角洲5个城市的人群整体移动性进行了比较分析。通过5城市在3类地点的出行行为特性分布比较的结果显示出了现今人们生活的多样性,休闲生活占据人们出行的主导地位,同时表明了5城人群出行有共性也有差异性,深圳市和其它城市的差异更为明显。从每日出行模式的统计结果显示虽然每日出行模式的种类繁多,但大部分人大部分时间的出行模式具有一定规律性。最后利用前面的个人规律性度量方法来统计通勤和非通勤车辆的出行规律性。
(4)通过对珠江三角洲5个城市的私家车轨迹数据分析发现,私家车活动区域不仅仅单限一个城市,5个城市的私家车出行有交互访问情况出现,体现了城市间人群的交流与融合性。本文首先利用前面的个人活动区域识别算法推理出的个人居住地来判定车辆所属的城市,然后从车辆数目交互和活动数目交互两方面来分析城市间人群交互关系。本文提出了一个评估方法,该方法利用吸引力、内向性、城市间交互的均衡程度以及城市间交互活动的中心点来评价群落中的各个城市的功能和地位。实验表明,广州市具有最强且比较均匀的对其它四个城市的吸引,展现了其在该群落中的中心地位。中山市具有最弱吸引力,且内向性最强,表明中山市在这个城市群落中交互作用最不明显,比较独立。
路网是导航、辅助驾驶以及自动驾驶技术必不可少的一部分。车辆的GPS轨迹可反映潜在的路网。从大量的车辆GPS轨迹中用软件自动推理路网使得地图的构建和更新速度大幅提升,花费大量减少。另外这种从大量轨迹中推理潜在路网的方式,使得推理出的路网本身就带有一些交通方面的信息,例如某路段在某些时段的拥堵程度、路口各方向上车辆的转弯概率等等。由于城市路网日益复杂,且城市级车辆轨迹数据集受到传输、存储成本的限制,导致轨迹采样率较低,为路网自动推理带来一定的挑战。本文尝试基于低采样率的私家车轨迹数据集,利用路网本身的特性和轨迹数据集的特征,提出了一种新的路网推理方法,能够有效提升复杂城市路网的推理精度。
在利用私家车GPS轨迹数据集构建城市路网的同时,私家车轨迹数据集也可以真实反映私家车主长期的出行活动。本文对大量私家车的长期轨迹数据进行分析,试图挖掘出个人出行模式以及对个人出行规律性进行量化度量。另外,本文也通过对大量私家车车主的活动轨迹进行整体分析,研究了群体出行行为特征,充分利用私家车轨迹数据包含的停等信息推理出人群的居住地、工作地和休闲地,并对人群在这三地的停留进行分析,以及统计每日出行次数分布、出行的单日模式特征等等。针对珠江三角洲5个城市的群体出行行为,分析比较了其出行距离和停留时长等分布的差异性特征。最后,对珠江三角洲5个城市之间的私家车出行趋向性进行了研究,通过城市间的私家车互达的车辆数目和活动数目两方面来体现城市间的人群移动性,潜在地反映城市之间的社会生活与经济活动的差异性与融合性。
本文以百度、高德公司的战略伙伴公司-深圳市麦谷科技有限公司提供的私家车轨迹数据集为基础展开研究,主要研究工作如下:
(1)城市日益复杂的路网使得从大量低采样率的GPS轨迹中推理路网变得非常困难,现有的大部分研究方法并不适合推理含复杂路口的路网。本文提出了一个可排除复杂路口GPS轨迹点干扰的路网推理简化方法-直接邻居路口检测算法,从而精确识别复杂路口的位置以及路口方向信息。该算法利用路口的方向信息,采用滑动窗口的方式抽取路段上的所有轨迹点,最终找到直接邻居路口并生成对应的路段信息。实验结果表明,本文构建的路网图与OpenStreetMap(一种众包形式的可编辑公开地图)相比,92.2%的路口位置误差在20米以内,91.6%的路段位置误差在8米以内。本文提出的路网推理算法在算法运行时间和识别精度上也明显优于几个经典路网推理算法,尤其是在复杂路口位置和方向的正确识别方面。
(2)私家车是城市道路车辆主体,其出行模式可以反映个人出行模式和移动规律性,其中如何描述个人移动特征是一个挑战。本文提出了一种基于私家车轨迹的个人移动规律性度量方法,可以方便检索出指定类型的规律性出行模式,也有利于作为量化指标来进行其它停留时间和目的地等的预测。本文首先从私家车轨迹中推理出可能的启停点,然后采用DBSCAN(Density Based Spatial Clustering of Applications with Noise)算法推理出个人的常访点,再利用Markov链来构建个人常访点之间的空时转换关系,最终设计适合私家车实际情况的熵率计算公式来度量个人移动的空时规律性。实验表明,其度量的规律性和视觉上的时空规律性非常一致,也比一般的主模式频率度量更加准确和全面。
(3)大量的个人出行行为可反映城市人群的整体移动性,私家车轨迹所特有的出行停等现象,可以从侧面反映城市整体的社会生活的运行模式。本文提出了一种基于DBSCAN聚类算法的私家车活动区域的识别算法,将私家车活动的区域有效地归为居住地、工作地和休闲地三类。本文首先利用前面推理出的路网来辅助剔除道路上的无效停等即堵车点,以提高对车辆活动的源和目的地提取的精度,然后对个人的有效停等点依据时空关系进行车辆活动区域的聚类识别。然后从整体上分析人群在居住地、工作地以及休闲地的停留时长和停留的开始以及结束时刻的分布。并统计人们的每日出行次数、出行距离以及出行的每日模式分布。然后对珠江三角洲5个城市的人群整体移动性进行了比较分析。通过5城市在3类地点的出行行为特性分布比较的结果显示出了现今人们生活的多样性,休闲生活占据人们出行的主导地位,同时表明了5城人群出行有共性也有差异性,深圳市和其它城市的差异更为明显。从每日出行模式的统计结果显示虽然每日出行模式的种类繁多,但大部分人大部分时间的出行模式具有一定规律性。最后利用前面的个人规律性度量方法来统计通勤和非通勤车辆的出行规律性。
(4)通过对珠江三角洲5个城市的私家车轨迹数据分析发现,私家车活动区域不仅仅单限一个城市,5个城市的私家车出行有交互访问情况出现,体现了城市间人群的交流与融合性。本文首先利用前面的个人活动区域识别算法推理出的个人居住地来判定车辆所属的城市,然后从车辆数目交互和活动数目交互两方面来分析城市间人群交互关系。本文提出了一个评估方法,该方法利用吸引力、内向性、城市间交互的均衡程度以及城市间交互活动的中心点来评价群落中的各个城市的功能和地位。实验表明,广州市具有最强且比较均匀的对其它四个城市的吸引,展现了其在该群落中的中心地位。中山市具有最弱吸引力,且内向性最强,表明中山市在这个城市群落中交互作用最不明显,比较独立。