小尺寸麦克风阵列声源定位的特征提取与识别方法

来源 :南京航空航天大学 | 被引量 : 2次 | 上传用户:BenBenBenBen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
麦克风阵列声源定位技术作为语音信号处理领域的一项关键技术在实际中有广泛应用。针对实际应用中如圆桌视频会议,声源所有可能出现的位置对应于若干离散区域的情况,可以从机器学习的角度解决声源定位问题。基于机器学习的声源定位方法考虑了声源先验位置信息,其中的关键步骤是声源位置的特征提取。目前已有的特征提取方法,如采用麦克风之间的到达时间差作为特征,在混响噪声环境下的小尺寸麦克风阵列声源定位中无法达到精度要求。本文通过一阶谐波声场分析并结合机器学习理论,研究了适用于室内小尺寸麦克风阵列声源定位的特征提取方法。此外,识别方法也对定位算法性能有一定影响。考虑到深度学习网络的优势,利用降噪自编码器深度学习技术,本文还研究了基于声强特征的小尺寸阵列声源位置识别方法。论文主要工作和贡献如下:1.研究了典型的基于到达时间差的特征提取方法,并通过仿真实验分析了混响时间、信噪比、阵列尺寸等因素对该特征提取方法性能的影响。分析结果表明,该方法在阵列尺寸较大、混响噪声较小的情况下,能够实现声源定位;在小尺寸条件下,定位精度有所下降,定位性能不稳定。2.提出了一种基于声强估计的鲁棒声源位置特征提取方法。该方法以基本声强估计法为基础,包括三个步骤。首先对每个时频点声强做相位变换加权处理以提高方法的抗混响性能;然后对各声强分量进行归一化处理以解决语音多样性带来的声强幅度差异导致的特征向量不匹配问题;最后充分利用由子阵列估计声强得到的冗余特征信息,提高算法的容错率,从而提高定位精度。仿真结果和实测实验结果均表明,本文提出的特征提取方法在混响噪声条件下定位精度更高,鲁棒性能较好,适用于小尺寸麦克风阵列的声源定位。3.提出了一种适用于小尺寸阵列的深度学习声源位置识别方法。该方法以声强信息作为特征,首先采用所有可能的声源位置特征数据对降噪自编码器网络模型进行无监督预训练,然后通过反向传播算法对网络参数进行有监督调优,最后将所需识别的声源位置特征向量输入训练好的网络进行声源定位。相比于已有的识别方法,降噪自编码器的抗干扰能力更强。仿真和实测实验结果均表明,本文提出的识别方法在混响噪声较大情况下识别率更高,在小尺寸麦克风阵列的声源定位方法中有一定优势。
其他文献
内部控制与产权关系密切。本文在对现有内部控制理论文献回顾与评析的基础上,结合现代企业不完全契约的性质,运用产权理论,系统研究了内部控制的本质、对象、目标、内涵、功
随着步入数字化时代,人们每天会接触大量的数据和信息,那么如何运用统计数据和信息做出合理的推理决策已成为现代人必备的能力。同时,《义务教育数学课程标准》也对统计教学
在班级管理中,班主任利用哲学上矛盾的对立统一原理,在班级管理中正确处理好宽与严的关系,能最大限度地做好班主任工作。第一,作为一名班主任,首先要从思想上清晰地认识到宽
气体流量是能源贸易结算、环境监测等诸多领域中的关键参数,其测量不确定度直接影响贸易公平和环境保护。气体流量基准装置是流量量值的源头,流量计是流量量值传递的载体。本
近年来,我国的保险行业在国家一系列扶持政策的鼓励下取得了飞速发展,保费收入的规模不断扩大,随之带来了巨额的资金可用余额。但由于受到互联网金融冲击,且保险市场的开放化化程度不断提高,保险费率愈加趋于市场化,保险公司的获利在未来将更多地由投资获得的利差主导。在愈加竞争激烈的国内保险行业,为了取得竞争优势,各大保险机构把如何更高效地利用资金进行投资作为竞争中心工作之一。本文以中国人保企业作为案例研究对象
高职院校不仅是教授学生理论知识、教会学生技术技能的地方,也肩负着培养学生良好行为习惯的神圣职责,而高职院校班主任则是该工作的主要引领者。当前,高职院校学生的不良行
中低收入阶层由于恩格尔系数过高,接受的税负转嫁较多,从而其税负水平与高收入者相差无几。在工资收入上展现了公平,但中低收入者得税负率并不能与收入水平相适应,富人避税的
流行病学资料表明,非甾体抗炎药(Nonsteroidal Anti-inflammatory Drugs,NSAIDs)可降低大肠癌的发病率,动物实验中NSAIDs可抑制结肠肿瘤的形成,使发生数量减少,肿瘤体积缩小,表现为
国家创新基金自1999年设立以来,中央和地方通过将近20年的摸索,在放大基金效益方面取得显著成绩。但现在对于推动创新创业高质量发展仍存在诸多不足,迫切需要从法学视角进行
<正>著名教育家陶行知先生曾说:"天天是创造之时,处处是创造之地,人人是创造之人。"任何人都具有创造的潜能,而小学阶段是培养学生创新精神和实践能力的重要阶段。小学低年级