乐曲近似重复模式的发现及其在音乐数据库检索算法中的应用

来源 :第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议(第一届全国和谐人机环境联合学术大会) | 被引量 : 0次 | 上传用户:lsssml1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在音乐信息检索领域,近似重复模式的发现是一个重要的研究课题.我们根据乐曲中重复模式的特点,提出了基于二维单侧连续匹配的近似重复模式发现算法,能更准确地发现近似重复模式.由于算法对乐曲采用了n-gram划分,并对划分后的片段建立hash索引,使算法的时间复杂性大大降低,并能在一趟计算过程中发现全部近似重复模式.最后,我们还讨论了如何选取近似重复模式,建立二级音乐数据库的索引机制,进一步提高音乐数据库的查询效率.
其他文献
本文通过对目前几种基于参照物的相机标定法进行分析,根据其中参照物设计方案为基础提出一种新的设计方案-彩色圆柱.该参照物的设计充分利用了RGB、HSV两种颜色空间的信息,并且通过SUSAN算法可以方便的定位校准点的图像坐标,然后再利用事先测定的空间坐标,就可以根据TSAI方法恢复拍摄每幅照片时相机的内外参数.与其他参照物相比,彩色圆柱参照物具有不存在遮挡、阴影效果小、参照点不共面、拍摄过程简单等优点
本文提出了一种改进的DWT(discretewavelettransform)域语音检索算法.该方法利用小波变换的多分辨率特性,在小波域的不同近似分量级,实现了多级查询语音记录的功能.实验表明:本文算法能够在建立的语音库中查询到所要求的记录,在冗余记录减少,计算量降低和查准率提高三方面有了很大的改进,具有广阔的应用前景.
近年来由于人们对自然和谐、友好智能的人机交互的向往,"情感计算"开始作为一个独立的课题受到研究者的普遍重视.本文针对"情感计算"领域中如何细致准确地获取真实的情感信息,设计实现了一个实验平台.实时准确地捕捉获取人们的多模态的情感信息(动作表情、情感语音,生理指标、情感评测数据),为下一步建立情感数据库提供了一个优越的平台.
本文提出了一种用于视频中运动对象检测的新方法.利用视频中相邻两帧的运动信息改进了基于背景的镜头探测方法,该方法探测到的镜头内部的背景相对不变.采用自适应高斯混合模型对镜头背景进行建模来探测前景点,用连通区域检测算法分割出运动对象.最后实验结果验证了该方法的有效性.
多视点视差估计是多视点视频系统中的关键技术之一,它能有效消除各个视点间的冗余性.但是多视点视差估计的计算复杂度非常高,是限制多视点视频系统应用的一个瓶颈,本文针对多视点视差估计巨大的计算量,提出了一种基于视差插值与相似度函数的多视点视差估计快速算法,实验证明本算法能在保证编码质量的前提下,大大减少视差估计计算复杂度,提高多视点编码系统性能.
本文研究了Ad-Hoc无线自组网络中多源视频流化传输时的动态速率分配方案--基于平均失真最小的速率分配方案(AODM),并在分析的基础上提出了改进的基于均方失真最小的速率分配方案(ASDM).文中所提出的方案是基于视频传输速率-失真模型,在视频流的接收端设计实现,并使用一种快速的视频内容层次划分方法进行流化传输.根据多个发送源场景下的实验结果,我们验证了所提出的速率分配方案ASDM在性能上要优于不
分布式视频编解码框架是与目前传统视频编解码框架相反的一种编解码方式.它将运动搜索,运动补偿转移到解码端而拥有一个低复杂度的编码端和高复杂度的解码端.然而Ad-Hoc网络环境下的终端都是计算能力、带宽受限的手持移动设备,高复杂的解码端不适应Ad-Hoc网络环境下的视频应用.因此,我们提出了一种适用于Ad-Hoc网络视频应用的自适应的分布式视频编解框架:ADVC.从试验结果可以看出,ADVC在低码率的
本文提出一种新的基于最优化的分配多媒体多速率组播流速率的方法.方法权衡了各流的QoS、异构性及公平性等,仿真实验证明了算法的有效性.
多视点视频是近几年视频处理领域研究的热点,它的提出体现了下一代多媒体应用网络化、交互性和真实感的方向发展.本文介绍了交互式多视点视频点播系统的结构框架和其支持的交互功能;简要介绍了虚拟视点合成算法;提出了基于视点间预测的多视点分组编码方案,能够提高编码效率和支持低延时的随机访问;以及描述了相应的系统网络传输交互控制协议.
目前,语音合成技术已经从人类的"理想"、"构建和谐社会"必不可少的手段,具体化为社会生活中方方面面的应用.对于汉语语音合成技术来说,是不是已经接近或达到了应用目标,是本文探讨的主题.文中简要报告了2004年在中国人民大学信息学院进行的汉语语音合成系统的评估实验结果,以此分析了汉语语音合成系统的可用性.评估采用主观印象评测(MOS)方法,选择了当前有代表性的五个汉语语音合成系统;从模块诊断评估和整体