异构信息集成中的查询处理与优化研究

被引量 : 0次 | 上传用户:chuanqi2009444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机和网络技术的发展呈加速态势,但各种应用的核心——数据,仍以不同形式存储在不同的系统中,分而不聚,聚而不合,呈分布异构状态。随着应用需求的不断增加,越来越多的用户希望能够透明地获取和处理来自这些海量信息源中的有用数据,实现多个软硬件系统以及不同信息源之间的互操作。然而,这些信息源物理上可能分布在异构环境的多个自治域中,有着不同的数据格式、存储方式、访问控制策略,逻辑上则可能在数据模型、操纵语言和数据语义等方面存在着很大差异。同时,这些信息源的可共享性、共享方式、共享内容等也可能随时发生变化。设计一个支持公共数据模型和统一查询语言的异构信息集成系统(HIIS),是实现这种交互操作的一种较好办法。异构信息集成系统可以屏蔽现在已有的各种异构数据管理系统不同的访问方法和用户界面,给用户呈现一个访问多种异构数据源的公共接口,提供一个集成处理多种数据源、整合多个数据查询结果的信息交互处理平台。 数据互操作是异构信息集成领域需要解决的主要问题。联邦数据库系统和多数据库系统是解决分布式异构环境中多个数据源的集成与互操作的两种方法,但这两者各有优缺点。在分析联邦数据库系统与多数据库系统差异的基础上,提出了一种基于多自治域的层次互操作模型(MDHI)。这种框架既满足了局域范围内的信息集成和处理的效率,又提供了一种集成广域范围内多种异构数据源的方法,更加符合当前实际应用的需要。 在分析异构信息集成系统基本模式结构的基础上,提出了一种基于 XML 的集成数据模型(XIDM)作为集成系统的公共数据模型,它将全局模式和输出模式中的数据模型描述成图的结构,可以集成包括数据库系统、文件系统、Web 信息系统等多种异构系统中的数据。为了建立集成系统中不同模式层次之间的联系,给出了全局模式到输出模式之间的全局映射以及输出模式到局部模式的局部映射,解决 XIDM 模型与关系数据模型、面向对象模型以及 HTML/XML 文档模型之间的映射问题。实例证明XIDM 模型及其模式映射方法是合理且有效的。 查询处理是异构信息集成系统的关键技术之一,查询分解、查询调度和查询优化是查询处理的核心内容。通过定义集成系统中查询处理的基本概念,分析 XML 查询的基本特点和要求,选定 XQuery 作为面向 XIDM 模型的查询语言,给出了查询处理 I<WP=4>的基本体系结构。在此基础上,给出了全局查询分解的基本原则和查询分解算法,并对查询分解算法的语义等价性进行了分析。 查询后处理是根据查询计划进行调度并通过后处理操作完成中间结果组装的过程,后处理操作主要由全局查询涉及的所有场地间运算来完成。通过对关系代数中的关系操作进行扩展,定义了面向 XIDM 模型的基于路径的元素簇操作,即 XRA 代数,用于表达查询后处理中子查询结果的合并处理。给出了查询后处理的转换规则,提出了一种连接树结构来表达集成系统的查询后处理操作,并对其进行规范化处理。通过引入连接图的概念,将连接规范树转换为等价的连接图,供查询后处理调度使用,在此基础上,给出了基于连接图的查询后处理多级并发调度算法,以尽可能提高查询后处理执行的并发性。 查询优化是异构信息集成系统中非常重要而又十分复杂的问题。针对查询后处理中的场地间运算代价,分析了影响后处理优化的代价参数,给出了局部数据源代价和通信代价的估计方法。连接运算往往是查询处理中开销最大的运算,以场地间连接和外连接运算组成的连接图为基础,给出了一种基于最小生成树的静态优化算法MST-SO 和一种基于统计推理的动态优化方法 SR-DO,以及结合这两种方法的混合优化策略,并通过实验仿真的方法对它们的优化性能进行了实验分析和性能比较,实验证明混合优化的性能更优。 基于上述理论和实验研究成果,研制和开发了一个基于 Web 服务的多自治域异构信息集成系统 Panorama Web One,它能够提供对 Oracle、Sybase、DB2 等数据库系统以及 HTML/XML 文档等其他文件类数据源的透明访问,主要功能涵盖了模式集成与模式信息管理、查询处理和查询优化等方面,并通过与原有系统的对比测试实验,给出了 Panorama Web One 系统的性能分析与评价。
其他文献
人民教师肩负的历史重任,是要使受教育者在德、智、体、美、劳等方面得到全面发展,为国家培养有社会主义觉悟的,有文化的劳动者。笔者以为,要完成这一历史重任,教师必须做到
文章阐述了《商务礼仪》精品课程建设的必要性;以建设背景、建设价值、建设基础为基本出发点,从创新教学模式、改革教学内容、改革教学方法和教学手段、建立基于行为导向的教
随着改革开放的深化和社会转型的到来,我国政治、经济和社会等诸多领域都在发生着结构性的变迁,传统的以单位为基础的基层管理体制已经明显不能适应现代城市发展和管理的需要,与
当前,反吸烟运动在世界范围内日益高涨。因此,如何提高烟草品质,减少烟草中有害化学成分的含量是烟草科技工作者面临的重要任务。完成这一任务的先决条件之一是开展烟草化学成分
本文开展的研究来源于音乐专业作曲人士的要求。随着语音识别技术的发展及计算机的广泛深入的应用,他们希望能够使用计算机来自动识别演奏的乐曲并实时完成乐谱创作。本研究即
钢琴是一种老少皆宜的西洋乐器。传入中国以来就受到广大人民群众的喜爱。钢琴学习不但有利于学生音乐素养的提升,还能陶冶情操,帮助塑造学生性格。因此,少儿钢琴教学近几年
一、个案基本情况2006年,初当班主任,内心有些忐忑,新生培训的第一天,我早早地站在了教室门口,笑脸迎接每一位同学,大家陆陆续续来得差不多的时候,一个打扮怪异的男生向我走
调查资料表明,目前一些青年教师,尤其是刚上岗的青年教师,教学方面还说得过去,教育管理,即“管导”方面存在着较为突出问题.一堂课四十五分钟,除了低头看教案,就是仰脸朝黑板
运用FDTD算法对同轴结构的辐照腔不连续性进行了分析,利用CST软件对其进行了结构设计和仿真计算。采用N型射频接头,内外导体采用开孔结构的聚四氟乙烯介质进行支撑,在宽频信
为了研究葡萄糖作为柴油替代燃料的稳定性和燃油经济性,该文基于稳定性试验数据建立响应面模型,并对葡萄糖水溶液乳化柴油(简称葡萄糖乳化柴油)进行配比优化和试验验证。根据亲油