论文部分内容阅读
随着科技不断进步,人们对视频质量的要求不断提高。然而,视频图像在实际采集和传输的过程中,不可避免的会引入噪声,从而影响到观众的视觉体验,因此去噪成为图像处理系统中必不可少的组成部分。另一方面,作为视频图像预处理中至关重要的一步,视频图像去噪效果会严重影响到视觉增强、特征提取、目标识别及目标分割等众多后处理算法应用的精确度。针对日益增长的高清视频图像去噪的实际需求,本文在现有的经典图像去噪算法以及相关的硬件加速方案研究和分析的基础上,对实际场景去噪性能优异的BM3D算法进行了深入的研究。主要工作包括:(1)深入分析了BM3D算法的基本原理,对算法中可调节的部分进行了实验对比和分析,包括各个参数、变换类型、聚合方法及其它方面。(2)针对实际视频采集系统中的低噪声方差、高速实时处理的应用要求,本文面向硬件结构对BM3D算法的各个步骤进行了改进,提出一种快速三维滤波去噪算法,并通过实验分析了算法的优点和存在的不足。针对算法在均匀平坦区域处理效果不理想的问题,对算法做出了进一步改进,将平坦区域去噪效果较好的块均值滤波方法与原算法相结合,提出一种快速三维均值滤波去噪算法。为了评估改进算法的性能,本文使用了主观视觉评价与客观指标PSNR和SSIM相结合进行实验,并选用去噪效果优良的NLM算法和K-SVD算法与本文算法进行实验对比。实验结果表明,本文提出的改进算法相比于其它两种算法去噪性能更优且具有较低的复杂度。(3)基于本文所提出的面向硬件实现的去噪算法,设计出一种低成本高效并行全流水线硬件架构。该架构包括块提取、块匹配、三维均值滤波以及聚合四级流水线。各级流水线之间无缝连接实现了并行全流水操作,同时充分挖掘了数据重用,不仅减少了存储访问带宽而且降低了资源占用。通过对架构自上而下进行模块划分,使用Verilog HDL实现和仿真验证。通过硬件仿真去噪与软件去噪对比的实验结果可知,本文提出的硬件架构具有与软件处理相同的去噪精度。同时,本架构在Xilinx公司Zynq-7000系列FPGA上综合布局布线后,工作频率可达279 MHz,最大输入分辨率为4K(3840×2160),吞吐率可达4K@33fps,资源占用率仅为16%且不需要任何外部存储器进行中间数据缓存。综上所述,本文基于BM3D算法面向硬件结构提出一种快速三维均值去噪算法,该算法在拥有优良去噪性能的同时具有较低的计算复杂度。并在算法的基础上提出的一种具有高精度、高吞吐率、低成本、灵活强等特点的高效并行全流水线硬件架构,该架构完全可以满足实际应用中对高清晰度视频实时高效去噪的要求。