一种基于人耳听觉感知和子带补偿滤波的鲁棒语言辨识特征参数提取算法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:xxbear0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前语言辨识系统所采用的特征参数没有充分考虑人耳听觉机制、鲁棒性较差的问题,提出一种符合人耳听觉感知特性的鲁棒语言辨识参数提取算法.该算法主要从两个方面提高特征参数的鲁棒性:在计算各子带能量时采用更符合人耳感知特性的Gammachirp滤波器组代替常用的三角滤波器组;为每一子带通道设计一个补偿滤波器.子带补偿滤波器的设计采用数据驱动的策略,通过补偿使得各子带滤波器输出信号的失真及环境噪音导致的失真同时达到最小.实验表明,文中所提出的特征在常见噪声环境下,性能均优于目前普遍使用的Mel频率倒谱系数特征及其衍生参数. In view of the fact that the characteristic parameters adopted by the speech recognition system do not fully consider the auditory mechanism of the human ear and have poor robustness, a robust speech recognition parameter extraction algorithm is proposed which is in line with human auditory perception. Improve the robustness of the characteristic parameters: replace the commonly used triangular filter bank with the Gammachirp filter bank which is more in line with the human ear perception when calculating the energy of each sub-band; design a compensation filter for each sub-band channel. The design of the compensation filter adopts data-driven strategy, and the distortion caused by the output signal of each sub-band filter and the noise caused by the environmental noise are minimized simultaneously through the compensation.Experiments show that the proposed features in the common noise environment are superior Mel Frequency Cepstral Coefficients and Their Derivative Parameters.
其他文献
目的 探讨双气囊内镜(DBE)在中消化道疾病诊断中的应用价值.方法 对53例行DBE检查的疑似中消化道疾病患者的临床资料进行回顾性分析,总结病变检出情况以及并发症、不良反应发
高迁移率族蛋白1(HMGB1)是一种重要的损伤相关分子模式(DAMP)分子,胞外HMGB1可通过激活其高亲和力受体-晚期糖化终产物受体(RAGE)介导多种细胞损伤以及应激状态反应,参与某些
为了大面积利用再生水灌溉,加大污水资源化力度,确保高质量的都市草坪,在永乐店试验站进行了不同灌溉水源灌溉草坪的试验研究.试验采用3种水源灌溉盆栽草坪:清水灌溉;清水和
糖尿病视网膜病变(DR)的发生发展受多种细胞因子的调控.除了既往研究的各种因子之外,新近发现,促红细胞生成素(EPO)、结缔组织生长因子(CTGF)、基质细胞衍生因子(SDF-1)等几
99mTcO4-是核医学科常用的甲状腺显像剂,为了解G raves病患者甲状腺对99mTcO4-的摄取和清除过程,我们对G raves病患者口服99mTcO4-后甲状腺辐射的γ射线剂量率进行了24 h监测
软弱层带是控制岩体稳定性的重要边界条件.软弱层带的工程特性是其物质基础与环境条件共同作用的结果.研究表明软弱层带的抗剪强度与塑性、干密度和含水量具有明显的相关性,
在傅里叶变换光谱仪研制中,基于迈克尔逊干涉仪的动镜机构研制是技术难点之一,而柔性铰链机构则是动镜机构的核心部分。利用简单的平行两杆机构为基体进行复杂化设计,得出一
以全光谱日光模拟器为对象,利用光学软件LightTools对其辐照特性进行仿真研究。分别建立光源和模拟器的光学系统仿真模型,并将辐照度仿真结果与实验结果进行对比,获得光学基
为模糊形态学双向联想记忆网络(FMBAM)提出一个学习算法.在理论上证明只要存在使给定的模式对集合成为FMBAM的平衡态集合,则该学习算法总能计算出相应的最大连接权矩阵对.该
为研究纳米硅晶粒成核生长动力学过程,采用脉冲激光烧蚀(PLA)技术,在室温,50~200 Pa的氩气氛围中,通过引入垂直于烧蚀羽辉轴线的外加气流,在水平放置的衬底上沉积了一系列纳米