基于均值聚类的交通事故因素挖掘及预测模型研究

来源 :牛子文 | 被引量 : 0次 | 上传用户:zdx_comeon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社会经济的快速发展,作为基础产业的道路运输业日益发展壮大,基础交通设施投资不断增加,高速公路、普通道路和城市道路建设速度加快,与此同时,道路交通事故率逐渐攀升,交通安全成为当下亟待解决的问题。道路交通事故具有复杂性和多样性的特点,事故成因往往是多方面的,与人、车、环境、道路等众多因素都有着直接或间接的关联,将事故原因全部归结为驾驶员的个人责任是不严谨的。伴随着大数据时代的兴起,数据挖掘技术和机器学习等方法开始被应用到交通事故分析中,充分利用事故数据探寻事故背后隐藏的规律并建立科学的事故预测模型对改善交通安全问题具有重大意义。本文进行的主要工作如下:1.在交通事故因素挖掘方面,本文针对关联规则算法中Apriori算法在面对较大数据集时效率低下的问题,从算法迭代搜索数据库的次数着手,通过加入候选项集计数器,对Apriori算法进行了局部优化。将传统Apriori算法在剪枝阶段需要多次遍历数据库来筛选频繁项集的方式转变为仅需遍历一次数据库即可确定出频繁项集。通过设计仿真实验与多种关联规则算法进行对比,实验结果证明优化后的Apriori算法在支持度阈值较低,数据量较大的情况下有更高的挖掘效率。针对面向交通事故的关联分析中关联结果清晰性弱的问题,利用聚类算法良好的聚类性能,将K-means聚类算法和优化后的Apriori算法串行组合,首先采用Kmeans聚类算法对原始事故数据进行分级聚类,划分出轻微事故、严重事故和重大事故三种事故等级,然后使用优化后的Apriori算法对各等级事故分别进行关联分析,挖掘出各等级事故中的强关联规则。通过实验和原关联规则算法相比,基于聚类的关联规则算法能够更清晰直观地挖掘出事故严重程度和各因素之间的关系。2.在事故预测模型研究中,采用遗传算法(Genetic Algorithm)改善传统BP(Back Propagation)神经网络的缺陷,构建GA-BP模型。传统BP神经网络由于网络中初始权值和阈值具有随机性的特点,比较容易陷入局部最优解。本文根据阅读文献发现遗传算法具有优异的全局寻优能力,使用遗传算法对BP神经网络初始参数进行迭代寻优,计算出最优的权值和阈值输入到BP神经网络中,通过仿真实验验证了GA优化的有效性,为下文组合模型的构造建立了基础。本文在实验的过程中发现,在单一模型的预测结果上,GA-BP模型对负样本有着较高的准确率,而支持向量机(Support Vector Machine,SVM)模型对正样本有着较高的准确率,因此,本文将GA-BP模型和SVM模型并行组合构建交通事故预测模型,使二者优势互补,通过给这两种模型分配不同的权重输出预测结果。实验结果表明,组合模型的各项性能指标均比较良好,在整体预测准确率上高于单一模型。
其他文献
随着量子计算机技术不断成熟,当今社会依赖的传统公钥密码体制在不久的未来将不再安全,亟需能抵御量子计算机攻击的后量子密码(Post-Quantum Cryptography,PQC)及其硬件实现技术。在最新标准化的PQC方案中,基于格的PQC方案是数量最多的一类方案。其中,系数加速生成单元由于占用资源大、参数配置灵活等特点极具研究价值。考虑到目前对高性能并同时支持多种格密码方案的系数加速生成单元研究
蛋白质设计的最终目标在于创造有特定功能的蛋白质。虽然蛋白质设计发展迅速,但依旧面临诸多问题,其中主要问题与主链设计有关。在多数蛋白质结构设计过程中,要先确定待设计蛋白质的拓扑构造,然后通过某种途径得到可设计性高的主链,研究者才可以在此基础上添加功能限制、设计侧链,进而进行下游的研究。他人文献中使用的主链设计方法包括片段拼接方法和参数化方法。片段拼接以已实验解析的高质量蛋白质结构为基础,将这些结构拆
腐败作为国家治理顽疾,其危害不可小觑,经过十多年的反腐败斗争,针对腐败行为本身的高压式反腐和针对权力约束的制度性反腐见效明显,“不敢腐、不能腐、不想腐”体制机制建设的各个环节互相照应衔接,彰显了中国特色社会主义腐败治理理念和实践的优越性。在实现国家治理体系和治理能力现代化目标的指导下,社会资本作为一种重要的非正式制度,既影响着反腐败正式制度“路径依赖”的形成,又刻画了腐败这一集体行动困境产生和发展
良好生态环境是实现中华民族永续发展的内在要求。为疏通“中央政府→地方政府→企业”的责任传导链条以改善环境治理效果,中央实施了迄今为止最大规模和最高规格的环境治理机制,即中央环保督察制度,以期通过“督政”、“督党”的责任传导,推进包括地方环境法治建设在内的环境保护长效机制。此背景下,政府部门和实务界迫切需要对中央环保督察的实施效果进行系统评估。同时,囿于数据和方法,学术界对中央环保督察如何影响环境法
当今时代,随着现代浏览器和前端技术迅猛发展,静态网页的开发成为一种不可阻挡的流行趋势,对于前端开发人员来说,一种能够有助于高效地实施敏捷过程,降低开发人员学习成本,推动运维和质量保障部门之间的沟通、协作与整合的系统成为亟待开发的需求。同时随着进入大数据时代,这种背景下,每时每刻新增的数据量对比过去有了指数级的增长。与此同时,随着流量和网络的普及,使得地理上的数据请求变得分散且冗杂,因此对网站性能的
学位
乙二醛是结构最简单的二醛化合物,国内产量接近20万吨/年,价格约为7 000元/吨,因利润空间和产能过剩的现状,乙二醛生产企业迫切需要发展其高值化转化方法。乙二醛缩二甲醇可由乙二醛与甲醇反应合成得到,市售价格为2 000元/千克,现阶段虽以进口为主,但国内企业正在积极攻关,其国产化指日可待。鉴于乙二醛缩二甲醇独特的化学结构及反应性,以该化合物为关键中间体发展乙二醛高值化转化的方法具有现实意义。本论
我国绵长的海岸线上粉沙质海岸分布广泛,这些粉沙质海岸除具有粉沙共性的特点外,从港口航道泥沙问题角度,其海岸地貌、泥沙来源、底质特性、泥沙运动规律、岸滩冲淤变化特征等并不完全相同。粉沙质海岸上建港普遍存在泥沙回淤问题。针对我国典型粉沙质海岸基本类型,提出了细分方法,对不同类型粉沙质海岸泥沙运动规律进行了分析;改进了航道泥沙回淤量计算公式中的临底含沙量计算方法;对典型沿岸输沙公式进行讨论的基础上,提出
乡村发展的主体缺位呼唤着精英人才返乡创业,促进返乡人才创业是对国家创业创新战略和乡村振兴战略的双重契合。随着我国经济增长进入新常态,外出劳动力由过去的单向流动演变为双向流动。随着“孔雀东南飞”到“八方凤还巢”的转变,返乡创业趋势也同步增长,为农村发展带来了“人回乡、钱回流、企回迁”的“雁归经济”效应。然而,返乡人才创业活动在蓬勃发展的同时,也面临着农村地区资源约束、资本市场发育不健全、创业者资金短