论文部分内容阅读
视频是集图像序列、图像、文字等为一体、被人们广泛使用的一种综合性媒体,在当今网络技术高速发展、各种媒体信息大量涌现的背景之下,为了实现对多媒体信息的高效访问,多媒体信息智能处理和检索工具的研制成为当务之急,视频信息处理和检索也已成为当前研究热点。
海量视频数据库的管理、索引、浏览和查询的研究才刚刚开始,如何解决大规模视频数据库的生成、索引结构等等都是非常有挑战的工作,因为这一领域涉及到一系列包括镜头分割、标题分割、场景分割、人脸检测与识别以及如何建立有效索引结构在内的多种关键技术。本文以在线镜头分割以及如何建立有效的索引结构为主要研究对象,深入探讨了实时在线镜头分割的技术实现以及各种索引结构在系统实现中发挥的重要作用。
在实时在线镜头分割中,本文提出了一种基本不解码,仅仅利用MPEG-2编码压缩域信息以及少量Ⅰ帧解码后信息来进行镜头分割的算法,该算法在大大降低系统负荷的前提下,同时也具有很高的镜头分割精度,很好的满足了系统的需求。
在系统索引结构实现中,本文详细探讨了高维索引结构的难点,并且提出了一种高性能,适合本系统的索引结构VA-Trie,该索引结构通过将高维数据分层,使得上层的Trie结构足够小能够驻留在内存当中,从而减少磁盘操作,加快检索速度;另外由于系统构建于MPEG-7框架下,系统中存在大量的XML数据,本文也根据系统中数据及查询特点,提出了一种高效的XML数据索引结构。系统研制目标非常明确,就是开发出电视节目的自动分类、索引、检索系统,本人在系统研制过程中所做的创新性工作包括在线镜头分割、高维数据索引结构以及XML数据索引结构的研究;工程性工作侧重于实现客户端与服务器的交互以及服务器端总控模块的实现。