基于深度强化学习的人群疏散路径规划方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:luiyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来公共安全事故频发,安全事故中的人群疏散成为研究的热点。当发生事故时,为了降低事故带来的危害应尽快将人群撤离事故现场。因此,安全事故中的人群疏散路径规划是一个重要的研究课题。人群疏散是一个复杂过程,大规模人群疏散演练受到组织难、成本高、人员安全性低等问题限制难以实现。计算机仿真技术的发展为模拟人群疏散提供了途径,使用人群疏散仿真技术能够模拟人群疏散过程,为安全事故中的人群疏散提供指导。因此,人群疏散仿真技术对于研究安全事故中的人群疏散意义重大。合理的路径规划能够提高人群疏散效率、保障人民生命安全,是人群疏散仿真研究的关键。然而现有的路径规划方法人为定义诸多疏散规则与位置状态导致真实性不足,并且这些路径规划方法在应用于人群疏散仿真时存在效率低的问题。针对这些问题,本文提出了一种基于深度强化学习的人群疏散路径规划方法。首先,本文提出了一种基于视频的行人轨迹提取及存储方法,该方法使用改进的深度简单在线和实时跟踪(Deep Simple Online and Realtime Tracking,Deep SORT)算法跟踪行人获取行人运动轨迹,并通过构建轨迹知识图谱(Knowledge Graph,KG)存储行人运动轨迹。其次,提出了一种高效的多智能体深度确定性策略梯度(Efficient Multi-Agent Deep Deterministic Policy Gradient,E-MADDPG)算法进行路径规划,提高路径规划的效率。然后,在上述方法的基础上提出了一种基于深度强化学习的人群分组疏散仿真方法。最后,在仿真平台上验证了本文提出的方法,该方法能够有效地提高人群疏散效率,为安全事故中的人群疏散提供指导。本文的主要工作及创新点如下:(1)针对现有路径规划方法人为定义疏散规则与位置状态导致真实性不足的问题,本文提出了一种基于视频的行人轨迹提取及存储方法来获取真实情况下的行人位置状态。首先,使用YOLO V3方法检测视频中的行人,采用一种基于无迹卡尔曼滤波(Unscented Kalman Filter,UKF)改进的Deep SORT算法来跟踪行人,提取真实行人运动视频中的行人运动轨迹。然后,通过构建轨迹知识图谱来存储获取的行人轨迹,有效保留了轨迹中蕴含的行人运动特征。在轨迹知识图谱基础上进行路径规划,能够将运动特征融入路径规划,提高路径规划的真实性。最后,通过实验验证本文改进的算法能够精确地跟踪行人。(2)针对现有人群疏散路径规划方法存在路径规划效率低的问题,本文提出E-MADDPG算法来进行路径规划,并针对路径规划定义了算法元素。该算法基于多智能体深度确定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient,MADDPG)算法,引入学习曲线优化经验池,采用高优先级经验回放策略改进算法采样策略,提高算法的效率。然后算法在轨迹知识图谱基础上定义了状态空间。实验表明本文提出的E-MADDPG算法能够提高路径规划的效率。(3)在上述研究的基础上,本文采用一种基于深度强化学习的人群分组疏散仿真方法模拟引导行人疏散。首先,利用K-means算法将人群分组,将分组后的人群划分为领导者与跟随者。然后,利用E-MADDPG算法对领导者进行全局路径规划,利用RVO算法驱动跟随者进行人群避障并跟随领导者疏散。最后,搭建人群疏散仿真平台,通过模拟实验,验证了本文提出的方法能够提高人群疏散效率,对于安全事故中的紧急人群疏散具有指导意义。
其他文献
导数及其应用是高考的重要考点之一.导数题能综合考查学生多方面的学科素养、关键能力和必备知识,渗透多种数学思想方法,其要求之高,难度之大,让广大考生心有余悸.文章以一道高考导数题教学为例,谈谈此类题的教学过程、设计意图及教学思考.
经济集聚作为当今世界区域经济发展进程中的普遍特征,是经济活动空间效率的重要保障。与此同时,城乡收入差距作为我国经济社会发展进程中的重要经济现象,长期以来也备受社会各界关注。许多的研究表明,经济集聚对于经济社会的发展进程存在着深刻影响,那么经济集聚是否有利于缩小城乡收入差距,进而实现空间效率与社会公平的双重兼顾?更进一步看,理清经济集聚与城乡收入差距的实际关系,探究其可能的作用机制,并采取可行的计量
当前社会经济到了一个重要关口,我国社会经济无疑也到了攻坚克难的重要阶段。在此背景下,小微企业的重要作用全面凸显,我国现有几千万家小微企业,为我国提供了1.5亿个就业岗位,是国民经济和社会发展的主力军。但在当前社会经济竞争环境中,小微企业抵御风险能力不足,经济压力较大。我国相继出台了一系列税收优惠政策为小微企业纾困解难,这些优惠政策旨在节省小微企业成本开支,减轻小微企业负担,帮助小微企业发展。论文归
近年,高铁建设快速推进,在社会交通运输中发挥出积极作用,给沿线城市的经济社会发展带来了多方面的影响。文章以四川省宜宾市为例,通过分析高铁对当地服务业发展的影响机理、影响领域和影响模式,认为高铁在时空压缩机制下产生的可达性提升效应、要素流动效应对于城市的商业贸易、旅游文化、科技服务等服务业的发展都会产生较大影响,在此基础上,提出了利用高铁的可达性和要素流动速率、扩大区位优势、降低发展成本和重新配置要
涡轮增压系统决定了发动机的进气能力,严重影响整机燃烧性能。为优化汽油缸内直喷(gasoline directinjection, GDI)发动机的热效率,利用GT-Power软件搭建了一维仿真计算模型,并基于试验数据完成模型标定。通过热力学仿真计算,分析了不同增压系统对发动机动力性、经济性的影响。研究结果表明:采用定压增压结构,能减少泵气损失,提高发动机在高速工况时的热效率。但其低速性能较差,不满
为探讨变温萎凋对白茶品质影响,以不同季节的贡眉白茶为研究对象,在传统萎凋过程中,加入10、30、50 s的短时热风(45℃)萎凋处理,研究变温萎凋对白茶的感官品质和主要生化成分的影响。结果表明,相比传统萎凋,30 s变温萎凋处理使贡眉白茶在感官品质上出现青气褪去、蜜香呈现、茶汤橙红、滋味甜醇的变化,呈现陈年白茶的特征;而10 s处理后仍旧带有新做白茶的青涩味;50 s处理后的白茶在干茶、叶底、汤色
朱永新教授曾经说过:“如果没有教师自身的榜样激励,很难让孩子真正热爱读书、热爱写作。”这句话充分显示了教师在学生学习过程中的引导力量和榜样作用,由此可见,师生共读共写是一个心灵的窗口、灵魂的寓所、青春的阳台,是一笔人生的精神财富。文章立足于农村初中语文课堂,针对以师生共读共写优化语文教学的策略展开研究与探索。
在软地面上的机动性能是军用高机动性越野车辆的主要性能之一,对于其野外作业有重要的战略意义。为了探究不同类型松软土壤地面路况对越野车辆机动性能的影响,将基于离散元法对土壤进行建模,通过进行土壤堆积角测试试验以及土壤圆锥指数试验对土壤进行刚度对标测试。通过DEM-MBD联合仿真的方法,利用精确的土壤模型对不可压缩干燥土壤、不可压缩湿润土壤、可压缩干燥土壤、可压缩湿润土壤4种不同类型土壤进行仿真分析,通
研究了丁二烯结构单元的含量(0~24.3%(mol))对反式丁戊橡胶(TBIR)性能的影响。结果表明,随丁二烯结构单元含量的提高,TBIR大分子链的热稳定性改善;硫化过程焦烧时间和工艺正硫化时间略有延长,硫化速率降低,交联密度略提高;硫化胶结晶性能大幅度削弱直至消失。强结晶性赋予丁二烯含量为0%(mol)和8.5%(mol)的TBIR硫化胶呈现强而韧的拉伸行为,其拉伸强度和定伸应力较高,拉断伸长率