Active XML数据管理基础问题研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:geniuscaobo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Active XML(Active eXtensible Markup Language)的提出,能够有效的解决当前分布式数据管理中存在的数据源异构性、交互性及自主性问题,为分布式Web数据管理提供了新的发展方向。AXML文档是一部分数据直接给出,另一部分数据以Web服务调用方式隐含给出的XML文档,通过触发这这些服务调用,可以获得其包含的隐含信息来扩充文档内容。AXML模式定义了符合约束条件的AXML文档集合。AXML数据管理需要考虑如下基础问题:(1)AXML数据交换是AXML的主要应用方式,而数据交换之前必须判定给定AXML文档通过触发其包含的服务调用是否能够转换成为符合目标模式要求的文档实例,从而引出了文档重写问题;(2)在某些情况下,还要考虑符合给定源模式的全部文档是否能够重写为目标模式实例,这就需要考虑模式之间的兼容性,该问题为模式重写问题;(3)AXML数据交换过程中,通常以查询方式来实现数据请求,而查询可满足性判定是执行给定查询的前提条件,通过判定给定查询的可满足性,可以过滤掉一部分不可满足查询,从而提高查询的执行效率;(4)保证AXML文档为有效文档是AXML数据管理的关键,也是AXML数据交换、文档查询的先决条件。本文基于树自动机理论,对AXML数据交换中存在的AXML文档重写和模式重写、AXML文档查询可满足性、AXML文档有效性检验问题进行了深入研究,目的是对上述问题提出有效的解决方法,从而让AXML能够更好的服务于分布式数据管理。第一,研究了AXML文档重写和模式重写问题。AXML文档重写问题是指判定给定文档通过触发其包含的服务调用是否能够将其转换成为符合目标模式的文档实例。AXML文档重写问题分为可能重写和安全重写,AXML文档可能重写是判定给定文档是否能够重写为目标模式的某一文档实例;AXML文档安全重写是判定给定文档的全部可生成文档是否能够重写为符合目标模式的文档实例。AXML模式重写问题是指判定符合给定源模式的全部文档是否能够重写为目标模式实例。首先,基于传统树自动机理论,定义了用于抽象描述AXML文档树的ADTA机(AXML DocumentTree Automata),基于ADTA机,给出了多项式时间复杂度的AXML文档可能重写判定算法,给出了算法的正确性证明;在ADTA机的基础上,定义了ADTA机补自动机,提出了多项式时间复杂度的AXML文档安全重写判定算法,给出了算法的正确性证明;然后,定义了用于描述AXML模式的ASTAr机(AXML Schema Tree Automata for Rewriting),给出了ASTAr机构造算法,ASTAr机定义了所有符合给定AXML模式约束的AXML文档集合;最后,通过分析AXML模式包含与模式重写的关系,基于ASTAr机,提出了多项式时间复杂度的AXML模式重写判定算法,分析了算法的正确性和有效性。第二,研究了模式约束下的AXML文档树模式查询可满足性问题。AXML文档查询可满足性问题是指判定符合给定模式约束的AXML文档是否满足给定查询表达式。首先,给出了AXML文档查询可满足性的形式化定义;然后,定义了用于抽象AXML模式的ASTAq机(AXML SchemaTree Automata for Queries),用于描述符合给定AXML模式约束的文档集合,定义了抽象树模式查询的TPQA机(Tree Pattern Query Automata),TPQA机描述了包含满足给定树模式查询表达式路径的文档集合;最后,基于ASTAq机和TPQA机,针对XPath树模式查询片段{“/,//,[ ]”},提出了一种多项式时间的AXML文档查询可满足性检验算法,分析了算法的正确性和有效性。第三,研究了AXML文档有效性检验问题。AXML文档有效性检验问题是指给定AXML文档及其服务调用规范,检验文档是否符合目标模式。定义了用于抽象AXML模式的ASTAv机(AXML Schema Tree Automata forValidation),该树自动机描述符合目标模式约束的文档集合,能够完成对给定文档当前状态的有效性检验;基于ASTAv机,通过分析服务规范与目标模式之间的关系,提出了一种多项式时间的AXML文档有效性检验算法,分析了算法的正确性和有效性。
其他文献
随着我国会计准则和税收制度改革的深入进行,财务会计与税务会计的差异越来越突出。本文深入分析了两者在收入确认等方面存在的差异,以期能够更好地帮助会计人员了解并掌握两者
食品损害惩罚性赔偿制度是《食品安全法》的重要创新,旨在发挥民事赔偿责任的惩罚、震慑和预防功能。但是该项制度在设计和法律适用上,还存在着请求权主体不明、连带责任的适用
时态GIS是近年来GIS领域在认识和实践方面的一项重要发展。本文报告了源于国家自然科学基金项目“林火行为的动态模拟信息系统”的时态GIS领域若干关键技术的研究。这些关键
为予构建和谐医患关系提供理论支撑.澳门大学法学院与中国卫生法学会·南方医科大学卫生法学国际研究院拟于2015年4月23日至26日.在澳门大学联合举办“第三届两岸四地卫生
随着多核处理器以及集群(高性能计算集群/高可用集群)系统在各应用领域的普及,并行计算将无处不在。并行程序设计将成为软件工程过程的必要环节,并行应用程序建模与编程将是
优化问题广泛存在于科学研究和工程实践,研究其求解方法一直富有吸引力与挑战性。最速下降法、牛顿法和共轭方向法等基于梯度的优化算法具有完善的数学基础,具有计算效率高、
民本思想是儒家最核心的价值概念之一,一直被儒家作为治国安邦、约束君权、德化群臣的指导思想。作为特定历史时期的产物,儒家的民本思想蕴含着丰富的思想内涵,在历史上也产
目前,我国大多数城市公共卫生间都采用水冲直排式,对水资源的浪费和对环境的污染越来越引起人们的重视,为此,作者研究和设计了一套机械传动设备,能对粪便在源头上进行自动收
跨校师徒带教是当下提升区域内教师专业素养的有效培养模式。然而在现实中,跨校师徒带教在时间、空间及针对性方面存在着一些问题,导致带教过程的不到位。解决这些问题,必须
本文围绕医生多点执业制度的相关问题对四川省泸州市医疗机构人员进行了问卷调查。从调查情况看,多数被调查者都支持实施该制度.但目前推行该制度尚存在以下四方面的障碍:一是医