【摘 要】
:
说话人分割机制的主要任务是对含有多个说话人的音频信号进行自动分割,使得理想情况下,分割后的每个语音片段只包含一个说话人。说话人分割机制综合了语音信号处理和模式识别
论文部分内容阅读
说话人分割机制的主要任务是对含有多个说话人的音频信号进行自动分割,使得理想情况下,分割后的每个语音片段只包含一个说话人。说话人分割机制综合了语音信号处理和模式识别等多项技术,在语者识别、说话人动态监测、音频信息检索等方面有着极为广泛的应用,是近几年语音信号处理领域的研究热点之一。论文所完成的主要工作包括:(1)设计并实施了基础性的说话人分割机制,进行了必要的测试与分析;(2)基于GBDT算法,设计并实施了重叠语音检测机制。(3)基于深度学习技术,设计并实施了语音非语音检测机制,在多种音频场景下验证了其性能,并将其应用到说话人分割机制中,取得了一定的效果;(4)基于深度学习技术,设计并实施了语音增强机制,在一定程度上保证了说话人分割机制的性能;
其他文献
食品是人类赖以生存和发展的首要物质资料,食品安全是关系国计民生的头等大事,与人们的日常生活、社会稳定息息相关,其重要性不言而喻。食品安全出现问题,不仅损害人体的健康
种业上市公司作为种子产业的领军者,其财务绩效引起了广泛关注,对种业上市公司进行财务绩效评价有着一定的现实意义。本文以种业上市公司的年度财务报告为基础,从企业经营者
德性伦理作为一种古老的伦理学传统,曾在古代医德学中占有重要地位。近代以来,随着医学社会化进程的不断加快,规则伦理逐渐走向医学伦理学与生命伦理学的前台,德性传统受到冷
农户小额贷款信用风险决策评价系统是建立一个既反映清偿能力又反映还款意愿的,并且反映金融界普遍认可的品德、能力、资本、担保、经营环境等5C信用评价原则的评价体系。农
利用未公开信息交易罪具备自己独立的构成特征,与内幕交易、泄露内幕信息及背信等犯罪相似,但并不完全相同。利用未公开信息交易罪与职务侵占罪和非法经营同类营业罪及操纵证
惠勒提出的延迟选择实验是量子双缝实验的一个扩展,它给出了一个特殊的结论:我们现在的行为对过去产生了影响。观测与实在紧密地缠绕在一起。这个实验深刻地揭示了微观世界在
在建立医务人员医德电子档案的基础上,利用信息技术、整合患者满意度调查,拓展建立医德医风管理系统,提出科学、规范、可操作性强的方法,搭建开放互动的医德医风管理平台,构
具有历史延续性和现代进步性的参与式品食文化的兴起,是饮食文化传承和创新的产物,这一文化形态强调以食者为中心,体现了主体自我意识的展示、表达和塑造。作为食者,这种参与
本文分别给出了蔗糖蒸发结晶过程中粒度分布、结晶糖量、浓度分布的数学模型。仿真结果证明了这些模型都能很好地拟合实际测量的相关数据分布。在此基础上建立蔗糖晶体生长动