智能会议室环境下基于音频特征的多说话人识别与跟踪

来源 :兰州理工大学 | 被引量 : 1次 | 上传用户：niudaben

【摘要】

：

通过麦克风阵列获取语音信号,从中提取出能够反应说话人位置的有效信息并不断跟踪说话人的当前位置是信号处理和目标跟踪领域中的一项重要研究内容,在智能会议系统、语音增强

【作者】

：

黄开杰

【机构】

：

兰州理工大学

【出处】

：

兰州理工大学

【发表日期】

：

2017年01期

【关键词】

：

智能环境多说话人跟踪粒子滤波环形麦克风阵列 K-means CUDA

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

通过麦克风阵列获取语音信号,从中提取出能够反应说话人位置的有效信息并不断跟踪说话人的当前位置是信号处理和目标跟踪领域中的一项重要研究内容,在智能会议系统、语音增强、机器人导航中具有广泛的应用。真实的智能环境中往往存在着多个说话人,说话人的数量和位置信息时刻都在变化,因此,研究数目可变的多说话人识别与跟踪问题对于构建可实施的智能会议系统、促进人机交互等具有更加实际的应用价值。本文的主要研究内容如下:(1)针对粒子滤波算法中重采样部分难以并行的问题,重采样导致了粒子滤波算法并行执行效率较低,因此在粒子滤波算法中引入并行策略,并在并行规约算法的基础上,结合并行前缀和的方法,克服粒子滤波算法在重采样时的粒子间依赖性,从而解决粒子滤波算法在并行实现过程中难以并行的问题。(2)针对并行粒子滤波算法在并行后的计算复杂性问题,分析了并行规约算法在GPU中内存访问模式,并行规约算法存在严重的内存访问冲突,本文利用填充寻址的并行前缀和方式,通过在每个共享数组索引中添加一个填充,实现改进共享内存数组的访问,解决并行规约在进行内存访问时存在严重的内存访问冲突问题,提高GPU硬件资源的利用率和算法实时性。(3)针对音频多目标跟踪中粒子滤波需要将量测值关联至对应目标,且每个目标需要一个粒子滤波器导致跟踪算法的计算量和所需粒子数量增加的问题,本文在并行粒子滤波算法的基础上,结合基于GPU的K均值聚类算法,实现音频多目标的跟踪,粒子滤波将多目标的状态作为整体进行更新和预测,然后利用基于GPU的K均值聚类算法对重采样后的粒子进行聚类,将同一目标的粒子归类,并利用声源区分度较高的环形阵列获取定位特征,有效解决了粒子滤波多目标跟踪中数据关联度低和跟踪精度低的问题。

其他文献

无速度传感器永磁同步电机矢量控制研究

在传统的永磁同步电机控制系统中，传感器的使用不仅阻碍了电机向高速化、小型化的方向发展，而且容易导致系统可靠性降低、环境适应能力变差。为了克服使用传感器带来的各种缺陷，对于无速度传感器技术的研究已经成为近年来电机控制领域的一个热点并且取得了丰硕的研究成果。本文针对永磁同步电机在全速度范围内的转速估算问题进行了比较深入的研究。本文在永磁同步电机双闭环调速系统基础上，设计了一种基于自适应观测器算法的转速

学位

永磁同步电机矢量控制无速度传感器自适应观测器高频信号注入

医学图像融合方法的应用研究

医学图像融合是一门集信号处理、人工智能技术等多种现代科学技术的学科，本文主要是围绕多模态医学图像融合的应用研究而展开的。医学图像融合包括很多种方法，没有哪一种方法是

学位

医学图像融合脉冲耦合神经网络小波变换双通道链接强度

船舶动力定位系统控制策略研究及应用

本文以某大型耙吸挖泥船为研究背景，结合实际应用功能针对定点定位（DP）和动态循迹（DT）两种工作模式下的控制策略进行系统的探讨和研究，本论文研究具有明确的工程应用背景和实用价值

学位

船舶动力定位PID算法变吃水自校正PID控制广义预测控制

贝叶斯网络-案例推理混合建模与应用

癌症、心脏病、糖尿病等重大突发疾病的早期发现和确诊是疾病成功治疗的关键。目前，对这些疾病的诊断主要依靠医生的临床经验。而我国的医疗资源相对不足，不同地区、医疗机构间

学位

BCBR模型贝叶斯网络案例推理医疗诊断乳腺癌

基于智能设备的蜂产品基础信息采集系统研究与实现

随着农产品质量安全特别是食品质量安全越来越受到关注，对蜂产品的安全生产和质量全程溯源的研究也进入了一个快速发展的阶段，而其中最为困难和关键的问题就是如何获得蜂产品生

学位

质量全程溯源蜂产品基础信息Android智能手机MSP430F5438

GPS软件接收机及其在飞行器控制中的研究

GPS(Global Positioning System,全球定位系统)是目前应用最广泛的一种卫星导航系统,由于其具有全球性、全天候以及连续实时三维定位等特点,在国民经济和国防建设发展中发挥

学位

全球定位系统软件接收机飞行器鲁棒控制自组织滤波算法

超分辨率图像重建关键问题研究

超分辨率图像重建以获得高分辨率图像为目的,其新颖之处在于突破现有成像设备的硬件限制,通过软件处理使已获得的低分辨率图像增加高频细节,移除退化,得到高分辨率图像。在人

学位

超分辨率图像重建亚像素级配准鲁棒建模阴影检测

双目视觉下振动台试件变形位移测量方法研究

振动台试验是研究结构试件抗震性能的一种重要方法,通过对振动台输入不同的激励信号,获取结构试件的特定测试点在不同激励信号下的速度、位移等运动参数。其中对特定测试点的位移进行相关分析,得到特定测试点处结构试件的变形位移具有重要的实际意义。本文将机器视觉技术应用到振动台试验中结构试件特定测试点处变形位移测量中,利用两台摄像机同步对随振动台一起运动的结构试件进行视频采样,然后通过对图像进行相关处理与分析,

学位

机器视觉技术人工标志摄像机标定目标匹配与跟踪变形位移

钢轨超窄间隙焊接电弧控制方法研究

国家“十三五”规划纲要指出,五年内将新建高铁里程1.1万公里,覆盖80%以上的城市,拓展区域连接,更好促进国民经济发展。高速铁路要求轨道具有高平顺性和高稳定性,为保证钢轨

学位

钢轨无缝焊接超窄间隙电弧焊电弧攀升弧焊电源电弧控制

开关磁阻电机位置检测方法的研究与实现

开关磁阻电机（Switched Reluctance Motor，简称SRM）具有结构简单、成本低、效率高、调速范围宽、容错能力强以及控制灵活等突出优点。开关磁阻电机运行时，需要根据转子相对位置对

学位

开关磁阻电机位置检测角度细分绝对式编码器CAN总线无位置传感器

智能会议室环境下基于音频特征的多说话人识别与跟踪

其他学术论文