【摘 要】
:
说话人性别识别是语音识别的一个重要领域,是基于说话人的声学特征进行说话人性别识别的技术。它最早是说话人识别领域的一个子研究课题,对语音信号先进行性别识别,再依据男
论文部分内容阅读
说话人性别识别是语音识别的一个重要领域,是基于说话人的声学特征进行说话人性别识别的技术。它最早是说话人识别领域的一个子研究课题,对语音信号先进行性别识别,再依据男女类别分别进行说话人识别,可以显著减少搜索空间和时间,在提高说话人辨别的准确率、提高系统的处理速度等方面都具有极大的意义。并且,基于性别相关的情感识别技术也一直是研究者处理情感计算的方法。传统的说话人性别识别系统,在纯净语音环境下以音素或单元音作为性别识别的训练语料的识别率较高,针对电话语音的性别识别也能达到较好的效果;而应用在连续语音或短时语音段上的识别率大大降低。在说话人性别识别系统中,特征参数的选取对系统的识别影响重大,单一的语音特征对识别率的提高有着局限性。本文尝试使用多种特征组合的方法来提升对连续语音的识别率。首先,对比了不同维数下的梅尔倒谱系数特征对识别率的影响;其次,选取了识别率较高的特征系数与基音和共振峰作为组合特征进行识别来进一步提高系统的识别率。另外,由于浅层的分类模型对于高维数据的处理能力不足,难以提取深层的特征信息,容易陷入局部最优解等问题。因此,引入深度学习的方法来进行分类识别,它使得深层神经网络的性能得到提升。最后,通过实验结果表明:本文使用的说话人性别识别方法在两组语音库下的识别率均能达到96%以上,且与浅层的分类模型对比,其对说话人性别的识别率更高,具有更好的识别性能。
其他文献
随着城市交通拥堵问题日益严重,急需充分利用现有道路交通资源。以锦州市古塔区为例,研究城市路网中交通盲点开放,充分利用路网中一切道路资源,解决城市交通拥堵问题。使用vi
腓总神经损伤常因外伤、压迫引起,临床表现为不能背屈,不能外翻,不能伸趾。小腿常有感觉障碍。走路呈跨阈步态。足下垂,并内翻。现介绍一例施今墨对药结合吕景山对穴治疗右腓
寻找生活中的数学,在课堂内容设计上联系生活实际学数学,可以提高学生对数学来源于生活的认识,体会数学与生活同在的乐趣,使学生切实学到终身受用的、有用的数学.
铣削加工是一种非常重要的加工制造方式,目前被越来越多地应用在各种金属制造加工业之中。在铣削加工钛合金薄壁件时,颤振是机床在加工过程中出现的一个很主要的动态不稳定现
在犹太—基督教的宇宙观图式中,存在着一位全能的、至善的上帝,他是世界的创造者和护理者。然而,信徒们必须面对这样的问题:世界上的恶从何而来?如果真的有这样的一位上帝,那
废电池随意丢弃可造成对环境的污染和人体健康的危害以及资源的浪费,因此,应回收利用。但我国作为电池最大生产和消费国,回收利用率很低,且回收上来的也无法处理,存在诸多矛
真菌中药桑黄为担子菌门(Basidiomycotas)锈革孔菌科(Hymenochaetaceae)针层孔菌属真菌火木层孔菌(Phellinus igniarius),具有广泛的药用价值,是目前国内外公认的抗癌药用真
上级"甩锅"基层现象本质上是基层治理中"上下"级风险规避博弈下的权责失衡。治理"甩锅"现象需要从三方面着手:一是做好"甩锅"现象的专项治理;二是加强资源向下配置、完善考核指标、利
桑黄素是黄酮类化合物中的一种,具有抗肿瘤、抗炎及抗氧化等作用。采用文献综述的方式,主要就其化学结构,药理作用和临床应用等进行综述,对桑黄素的生物活性研究进展进行了介
船舶是一种综合性的复杂弹性结构,在营运过程中很容易受到各种激励的影响而产生振动现象,解决船舶振动问题一直以来都是船舶领域研究的热点和难点。船舶振动可导致船体结构产