【摘 要】
:
音频场景检测机制的主要任务是对一个含有多种音频场景的音频流进行自动标注,它综合了信号处理和模式识别等多项技术,在很多应用方面均占有重要地位,比如音视频的检索,也可作
论文部分内容阅读
音频场景检测机制的主要任务是对一个含有多种音频场景的音频流进行自动标注,它综合了信号处理和模式识别等多项技术,在很多应用方面均占有重要地位,比如音视频的检索,也可作为语音识别,声纹识别等应用的前端。本文的主要工作如下:(1)实现并优化两个音频场景检测的基础系统,完成了基础系统的性能测试;(2)进一步对系统进行改进,实施了参数自适应算法,通过使用测试数据对系统的模型和阈值更新,使得系统参数与当前测试数据相匹配,系统性能得到了提升;通过使用新的谱特征与现有系统融合,提高了系统的抗噪性;对检测到的音乐信号按音乐调性进行细分类;最后尝试了使用基于NMF特征做语音非语音分类,并与现有基础系统进行比较;(3)实现了基于非负矩阵分解(Non-negative Matrix Factorization,NMF)算法的降噪技术,通过对比基于NMF和基于谱减法的降噪技术,根据不同的噪声类型将这两种技术融入现有的场景检测机制中,提高了系统的性能;(4)完成了将原基础系统移植为在线音频场景检测系统的方案设计与实施,并结合在线系统的特点,实现了在线话音检测。通过对在线系统阈值和模型的实时更新,提高了系统的性能;
其他文献
实时时钟管理在黑匣子设计中是必需的和非常重要的任务,而采用功能强大的时钟管理接口芯片是实现这一任务的十分有效的手段。分析了黑匣子技术中时钟管理的要求,说明了实时时
在对Web应用挖掘的基本步骤作系统性研究的基础上,设计了一个Web应用挖掘可视化系统。该系统能够对用户访问Web时服务器方留下的访问记录进行挖掘,从中得出用户的访问模式和
以吴江公路信息系统开发为例,介绍了公路信息系统的架构,公路基础数据库的设计,基于桩号的线性坐标系统变换,桩号定位和桩号识别技术。采用(B/S)和(C/S)相结合的模式组建信息系统,以公路基础数据库为核心,针对管理部门和公众开发不同服务。将地图数据、属性数据、路产设施数据及交通管理数据分离,以公路路线为基本单位进行管理,以事件表形式存储所有相关路产设施。利用车载GPS设备获取路线资料,利用桩号进行线
以南昌航空大学学生体育消费现状为研究对象,主要针对体育消费动机进行调查,结果表明学生体育消费动机主要有五类,其重要性顺序排列依次为:身心健康(50.1%)、审美娱乐(30.2%)、社会交往(10
针对军事配送的特点,以“等待损失”和运输成本最小化为目标,建立了问题的数学模型,并应用蚁群算法求解了这一问题。算法中改进了状态转移规则,设计了局部搜索模块。为测试算
文章简述了我国高速公路及其通信系统建设的现状,分析了我国高速公路通信系统的特征和功能,提出并论述了以"建立统一的网络通信平台,服务交通信息化"为目标的高速公路通信系
大港油田D区块为复杂断块油藏,面临剩余油分散、含水率高以及采收率低等现状,其地质储量占整个油田的50%以上。本文以大港油田D区块为研究对象,运用了油藏数值模拟技术,进行了动态分析评价和生产历史拟合研究,分析了剩余油分布及其潜力,最后优选了二次开发调整方案。本文从水驱控制程度,注采对应率和油层动用程度等方面,综合评价了大港油田D区块的开发效果,经分区块分析得出大港油田D区块整体为三类开发水平。从井网
合同能源管理是目前一种先进的中央空调运行管理措施。介绍了合同能源管理的概念、特点,阐述了合同能源管理的类型及其运作程序,分析了合同能源管理在空调领域的应用空间,并
重金属离子污染是环境污染一大杀手。在众多污水处理的方法中,生物吸附技术是最常见且成本最低的方法,原因是生物吸附剂对环境友好并且易于大量获得。稻壳粉具有一定韧性、多