【摘 要】
:
通过麦克风阵列获取语音信号,从中提取出能够反应说话人位置的有效信息并不断跟踪说话人的当前位置是信号处理和目标跟踪领域中的一项重要研究内容,在智能会议系统、语音增强
论文部分内容阅读
通过麦克风阵列获取语音信号,从中提取出能够反应说话人位置的有效信息并不断跟踪说话人的当前位置是信号处理和目标跟踪领域中的一项重要研究内容,在智能会议系统、语音增强、机器人导航中具有广泛的应用。真实的智能环境中往往存在着多个说话人,说话人的数量和位置信息时刻都在变化,因此,研究数目可变的多说话人识别与跟踪问题对于构建可实施的智能会议系统、促进人机交互等具有更加实际的应用价值。本文的主要研究内容如下:(1)针对粒子滤波算法中重采样部分难以并行的问题,重采样导致了粒子滤波算法并行执行效率较低,因此在粒子滤波算法中引入并行策略,并在并行规约算法的基础上,结合并行前缀和的方法,克服粒子滤波算法在重采样时的粒子间依赖性,从而解决粒子滤波算法在并行实现过程中难以并行的问题。(2)针对并行粒子滤波算法在并行后的计算复杂性问题,分析了并行规约算法在GPU中内存访问模式,并行规约算法存在严重的内存访问冲突,本文利用填充寻址的并行前缀和方式,通过在每个共享数组索引中添加一个填充,实现改进共享内存数组的访问,解决并行规约在进行内存访问时存在严重的内存访问冲突问题,提高GPU硬件资源的利用率和算法实时性。(3)针对音频多目标跟踪中粒子滤波需要将量测值关联至对应目标,且每个目标需要一个粒子滤波器导致跟踪算法的计算量和所需粒子数量增加的问题,本文在并行粒子滤波算法的基础上,结合基于GPU的K均值聚类算法,实现音频多目标的跟踪,粒子滤波将多目标的状态作为整体进行更新和预测,然后利用基于GPU的K均值聚类算法对重采样后的粒子进行聚类,将同一目标的粒子归类,并利用声源区分度较高的环形阵列获取定位特征,有效解决了粒子滤波多目标跟踪中数据关联度低和跟踪精度低的问题。
其他文献
在传统的永磁同步电机控制系统中,传感器的使用不仅阻碍了电机向高速化、小型化的方向发展,而且容易导致系统可靠性降低、环境适应能力变差。为了克服使用传感器带来的各种缺陷,对于无速度传感器技术的研究已经成为近年来电机控制领域的一个热点并且取得了丰硕的研究成果。本文针对永磁同步电机在全速度范围内的转速估算问题进行了比较深入的研究。本文在永磁同步电机双闭环调速系统基础上,设计了一种基于自适应观测器算法的转速
医学图像融合是一门集信号处理、人工智能技术等多种现代科学技术的学科,本文主要是围绕多模态医学图像融合的应用研究而展开的。医学图像融合包括很多种方法,没有哪一种方法是
本文以某大型耙吸挖泥船为研究背景,结合实际应用功能针对定点定位(DP)和动态循迹(DT)两种工作模式下的控制策略进行系统的探讨和研究,本论文研究具有明确的工程应用背景和实用价值
癌症、心脏病、糖尿病等重大突发疾病的早期发现和确诊是疾病成功治疗的关键。目前,对这些疾病的诊断主要依靠医生的临床经验。而我国的医疗资源相对不足,不同地区、医疗机构间
随着农产品质量安全特别是食品质量安全越来越受到关注,对蜂产品的安全生产和质量全程溯源的研究也进入了一个快速发展的阶段,而其中最为困难和关键的问题就是如何获得蜂产品生
GPS(Global Positioning System,全球定位系统)是目前应用最广泛的一种卫星导航系统,由于其具有全球性、全天候以及连续实时三维定位等特点,在国民经济和国防建设发展中发挥
超分辨率图像重建以获得高分辨率图像为目的,其新颖之处在于突破现有成像设备的硬件限制,通过软件处理使已获得的低分辨率图像增加高频细节,移除退化,得到高分辨率图像。在人
振动台试验是研究结构试件抗震性能的一种重要方法,通过对振动台输入不同的激励信号,获取结构试件的特定测试点在不同激励信号下的速度、位移等运动参数。其中对特定测试点的位移进行相关分析,得到特定测试点处结构试件的变形位移具有重要的实际意义。本文将机器视觉技术应用到振动台试验中结构试件特定测试点处变形位移测量中,利用两台摄像机同步对随振动台一起运动的结构试件进行视频采样,然后通过对图像进行相关处理与分析,
国家“十三五”规划纲要指出,五年内将新建高铁里程1.1万公里,覆盖80%以上的城市,拓展区域连接,更好促进国民经济发展。高速铁路要求轨道具有高平顺性和高稳定性,为保证钢轨
开关磁阻电机(Switched Reluctance Motor,简称SRM)具有结构简单、成本低、效率高、调速范围宽、容错能力强以及控制灵活等突出优点。开关磁阻电机运行时,需要根据转子相对位置对