基于实体描述属性技术的XML重复对象检测方法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:web53dns
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于XML文档越来越广泛地被用于信息交换与集成,其数据质量问题引起了人们的关注.解决由数据质量引发的问题,实体识别技术非常关键.当实体识别被应用于XML数据中时,最为关键的操作是实体数据对象的匹配.为了克服现有方法的不足,在海量XML数据上进行高效的重复对象检测,文中提出一种基于实体描述属性技术的高效XML重复数据对象检测方法.它将所有标签属性与结点统称为属性,用实体来描述属性,通过属性的属性结点表的构建,快速地找到在某个属性上相同的所有实体对象,然后比较它们是否重复.此方法的优势体现在无需比较所有实体对
其他文献
由于我国的音乐教育深受'西方中心论'的影响,本土音乐教育在学校的音乐教育中往往被忽视.进行本土音乐教育时如何摆脱西方音乐先入为主的影响,以一种客观、公正的态
加强国防动员建设,既是实现强军目标的重要内容,也是确保军队有效履行使命任务的关键环节和重要保证。按照实现强军目标和维护国家安全的使命要求,重新审视沿海大中城市国防
目的探究埃索美拉唑与奥美拉唑治疗胃溃疡患者的临床疗效。方法选取我院2012年11月至2014年12月收治的胃溃疡患者100例作为研究对象,随机将其分为对照组与治疗组,每组患者各5
鉴于机械加工行业中,水平除尘管道内沉积粉尘二次扬起形成的爆炸常会给人们的生命财产造成巨大的损失,以常见的铝合金粉尘作为研究对象,通过自主设计的水平管道试验平台、粒
本试验旨在研究涂膜保鲜剂对蛋壳"薄斑"及蛋品质的影响。选择同日产无"薄斑"海兰褐鸡蛋185个分为对照组、液体石蜡组和聚乙烯醇组,每组60个,储藏22d,每5d左右观察一次"薄斑"
目前,立法机关正在加紧推进民法典各分编的编纂工作,力争在2020年全部完成民法典编纂工作。在《民法典物权编(草案)》中,除了继承原有《物权法》之外,还存在很多值得研究和关
用Mathematica和简并微扰理论计算了氢原子第一至第六激发态(2-7)在较强磁场中的能级分裂(不考虑自旋),并讨论了简并微扰理论的适用条件.数值结果表明:在微扰理论适用的条件下,磁
目的总结门诊注射室患者发生晕厥的原因及护理措施。方法回顾性分析12年6月至15年6月间在我院注射室发生晕厥的46例患者之临床资料,总结其发生的原因和护理体会。结果发生晕
摘要为了探讨不同退化程度高寒草地土壤微生物量碳分布变化规律,在具有典型退化特征的高寒草甸与高寒草原研究样地开展野外调查,采集土壤样品,进行室内土壤微生物量碳等指标的测
产力、产道、胎儿是影响孕妇正常分娩的常见因素,但是分娩前刺激既可以产生生理上的应激,也可以产生精神心理上的应激。产妇精神心理因素能够影响机体内部的平衡、适应力和健