论文部分内容阅读
二十多年来,不断累积的IGS基准站坐标数据为大地测量学和地球动力学研究提供了丰富的基础数据,也为GNSS坐标时间序列的研究提供了坚实的数据支撑。GNSS坐标时间序列中蕴含了丰富的物理信息与数学规律,不仅能体现出测站受到同一区域构造应力场控制下的继承性构造运动,同时也包含了由地球物理效应等因素导致的非线性变化。GNSS坐标时间序列的精确分析,对建筑物的变形监测、气候气象预测、区域内地壳形变等研究具有重要意义。由于GNSS坐标时间序列中的异常值对观测结果的可靠性与数据分析的准确性会产生较大影响,尤其对高精度GNSS数据应用带来不利影响;另一方面,剔除异常值后,数据缺失会导致基准站获取的站速度产生偏差,基于此本文在异常值探测的基础上开展插值工作,以削弱数据缺失导致的估计偏差。最后,本文对GNSS坐标时间序列建立具有抗差能力的预测模型,可为灾害预测预警提供理论与技术参考,并进一步拓展基准站坐标序列的应用价值。本文在此背景下,以非线性GNSS坐标时间序列作为主要研究对象,对传统异常值探测与修正方法进行总结,并进行研究拓展,本文主要工作如下:(1)针对GNSS高程坐标时间序列的非平稳性、非线性导致局部异常值探测困难的问题,提出一种四分位距(IQR)与局部异常因子(LOF)相结合的异常值探测方法。实验结果表明,LOF算法较传统方法的异常值探测更加准确,且对局部异常值有较好的敏感性;而IQR-LOF方法能够提升单一LOF算法在GNSS坐标时间序列中的适用性,并能得到更高精度的建模数据。(2)针对GNSS坐标时间序列中存在数据缺失的问题,将Prophet模型应用于GNSS坐标时间序列的插值。通过设计不同的数据随机缺失比例和连续缺失长度,使用Prophet模型、拉格朗日与三次样条方法进行对比实验。实验结果表明,Prophet模型在GNSS坐标时间序列中较传统方法插值精度更高、稳定性更好,且对于连续缺失的数据插值有着明显的优势。(3)深入分析异常值对GNSS坐标时间序列预测精度的影响。首先利用LOF算法探测坐标数据中的异常值,剔除探测到的异常值并使用Prophet模型对空缺数据进行插值,最后使用随机森林模型(Random Forest,RF)进行预测。实验结果表明,剔除异常值的数据预测精度更高,从而体现了异常值探测的必要性。(4)针对非线性GNSS坐标时间序列数据波动大、异常值多等问题,在深入分析Prophet模型与随机森林模型特性的基础上,构建了Prophet-RF组合预测模型。该组合模型解决了Prophet模型对时间序列非线性部分预测能力较弱的缺陷,且具有较强的鲁棒性。实验结果表明,Prophet-RF组合模型较单一的Prophet模型能更好的表现高程方向时间序列的变化趋势,并得到更高精度的预测数据。