论文部分内容阅读
目标检测是一个具有挑战性的计算机视觉问题,具有广泛的应用前景。基于视觉对道路环境的感知是辅助驾驶系统重要的信息获取手段,而在众多的路面信息中,交通信号灯提供的路面通行信息尤为重要。它是车辆通行的指挥棒,道路畅通的关键。交通灯包含了重要而精确的信息,具有非常高的检测价值。本文将研究并实现一个基于嵌入式GPU的交通灯及数字检测系统。针对交通灯检测任务的特点,即准确率高和检测速度快,本文选择了深度学习回归法中的YOLOv3模型进行深入的研究。首先,对YOLOv3的特征提取网络做出改进。设计一个下采样块包括3×3和5×5的卷积核以及最大池化层,用于替换原有网络特征谱尺寸缩减的卷积层,以减少特征提取网络对特征的丢失。其次,在YOLOv3检测网络的基础上,添加了以4为步长的上采样,将深度特征与不同浅层特征融合,使得特征谱输出特征更全面,提高深度特征在多尺度检测网络中的复用并提高检测率。接着,本文引入轻量化网络MobileNet以降低改进后YOLOv3模型的参数量和计算量,从而提高推理速度。最后,通过K-means聚类选择锚框的数量和尺寸,从而提高检测精度和召回率。本文制作了包含数字灯、转向灯和交通信号灯在内的15分类交通灯数据集。在其上对设计模型进行测试,结果表明模型具有较好的检测准确性。此外,本文使用的NVIDIA Jetson Tegra X2嵌入式平台,自带GPU和TensorRT推理加速库,满足模型对算力的需求。TensorRT通过减少计算精度和精简网络结构,使得GPU利用率更高。使用TensorRT加速后,在降低极少精度的前提下,极大的提升了模型在嵌入式平台的推理速度。本文采用多线程检测,使得视频读取和模型推理互不干扰,从而达到实时检测的目的。本文设计的交通灯及数字检测系统是基于高级辅助驾驶系统实现的。系统将检测到的交通灯信息传递给辅助驾驶系统的主控单元,从而辅助决策。在同源和非同源场景下测试表明,该系统对中、近距离的交通灯目标具有良好的检测效果,检测平均帧率在20FPS以上,能够适应低速驾驶下的检测任务。