论文部分内容阅读
智能车路系统可以有效提升道路交通的安全性与通行效率,充分全面的测试是确保其规模化应用的重要前提。基于场景的测试,因其在测试效率及成本方面的优势,成为一种重要的测试方法。然而,由于道路交通的影响因素众多,如何找到极限与典型的交通场景是开展这类测试的关键。在先进车载传感器及实时数据采集系统的帮助下,人们获得了大量真实环境下高维度的自然驾驶数据,这些数据中蕴含了丰富的交通场景信息。现有研究主要从单车操纵角度出发(如跟车、换道等),仅对某一特定场景进行分析,其提取场景并未充分利用现有自然驾驶数据的高维度特性。本文针对高维度的自然驾驶数据集,以极限与典型场景统计特征为基础,提出了一种数据驱动的“划分-特征提取-聚类”测试场景提取与分析方法。主要研究内容如下:1)数据预处理及数据集分割。本文以美国SPMD项目的DAS2自然驾驶数据集中373966条数据作为样本数据,对样本数据在采集过程中因各种不确定因素导致的数据缺失、重复、异常等情况进行数据预处理,并为了消除数据之间的量纲影响,对数据进行归一化处理。根据极限与典型场景的定义,使用Isolation Forest、Elliptic Envelope、Local Outlier Factor和One-Class SVM四种算法对数据集进行分割,从速度、方向盘转角等汽车运动学数据出发,对分割结果进行对比分析,认为Isolation Forest算法对数据集的分割结果最好。因此使用Isolation Forest算法将预处理后的数据集分割为极限与典型驾驶行为数据集,并提取其中的驾驶事件。分割后的极限、典型驾驶行为数据集中的样本数量大约分别占总样本数的10%、90%。2)利用自编码网络进行数据特征提取。针对驾驶事件数据维度太高、特征参数太多而无法直接进行聚类的问题,为提高聚类算法的性能及聚类结果的可解释性,分别使用了普通自编码、去噪自编码和变分自编码网络对驾驶事件数据进行训练和测试。使用Tensorflow的权值提取方法进行训练后的最优权值提取,利用这些权值进行驾驶事件数据的压缩和特征的计算提取,提取了数据的三维特征。通过收敛步数、收敛损失等多个指标对三种自编码网络的性能进行了对比,结果显示去噪自编码网络的性能最好,因此选取去噪自编码网络的降维结果为特征提取的结果,并作为聚类算法的输入。3)极限-典型场景的提取与分析。首先,通过K-means、DBSCAN、Mini Batch K-means、BRICH等聚类算法对驾驶事件数据进行聚类,根据CH分数、轮廓系数等聚类性能评估指标的计算结果,选取K-means聚类算法作为最优聚类算法并确定最优聚类簇数,通过K-means算法将极限-典型驾驶行为数据集中的数据分别分为4类、6类;其次,通过对每个数据集中的每个类进行速度、加速度、方向盘转角等重要特征参数统计分析,得出每个场景的数据特点;最后,通过对数据特点的提取及分析,分别提取出极限与典型场景。由于使用传统的场景定义方法对本文提取的场景进行描述较为困难,为了能够更好的区别和刻画场景之间的特征及不同,本文提出了速转比、车辆密度等复合参数,通过这些复合参数值可对场景进行一定程度的度量,为场景的分析提供一定的参考。