基于实体描述属性技术的XML重复对象检测方法

来源 :计算机学报 | 被引量 : 0次 | 上传用户：web53dns

【摘要】

：

由于XML文档越来越广泛地被用于信息交换与集成,其数据质量问题引起了人们的关注.解决由数据质量引发的问题,实体识别技术非常关键.当实体识别被应用于XML数据中时,最为关键

【作者】

：

李亚坤王宏志高宏李建中

【机构】

：

哈尔滨工业大学计算机学院

【出处】

：

计算机学报

【发表日期】

：

2011年11期

【关键词】

：

XML 数据集成数据质量实体识别

【基金项目】

：

国家自然科学基金(61003046,61111130189,60933001,61033015,61133002);国家“九七三”重点基础研究发展规划项目基金(2012CB316200);国家博士后基金(20090450126,201003447);教育部博士点基金(20102302120054);哈尔滨工业大学优秀青年教师培养计划(HITQNJS.2009.052)资助~~

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

由于XML文档越来越广泛地被用于信息交换与集成,其数据质量问题引起了人们的关注.解决由数据质量引发的问题,实体识别技术非常关键.当实体识别被应用于XML数据中时,最为关键的操作是实体数据对象的匹配.为了克服现有方法的不足,在海量XML数据上进行高效的重复对象检测,文中提出一种基于实体描述属性技术的高效XML重复数据对象检测方法.它将所有标签属性与结点统称为属性,用实体来描述属性,通过属性的属性结点表的构建,快速地找到在某个属性上相同的所有实体对象,然后比较它们是否重复.此方法的优势体现在无需比较所有实体对

其他文献

反思:全球化时代本土音乐教育的困惑

由于我国的音乐教育深受'西方中心论'的影响,本土音乐教育在学校的音乐教育中往往被忽视.进行本土音乐教育时如何摆脱西方音乐先入为主的影响,以一种客观、公正的态

期刊

本土音乐教育跨文化解困与突围

切实加强沿海大中城市国防动员建设

加强国防动员建设,既是实现强军目标的重要内容,也是确保军队有效履行使命任务的关键环节和重要保证。按照实现强军目标和维护国家安全的使命要求,重新审视沿海大中城市国防

期刊

国防建设沿海大中城市动员建设

埃索美拉唑与奥美拉唑治疗胃溃疡门诊患者的效果

目的探究埃索美拉唑与奥美拉唑治疗胃溃疡患者的临床疗效。方法选取我院2012年11月至2014年12月收治的胃溃疡患者100例作为研究对象,随机将其分为对照组与治疗组,每组患者各5

期刊

埃索美拉唑奥美拉唑胃溃疡患者临床疗效

水平管道弱激波扬起沉积粉尘运动特征研究

鉴于机械加工行业中,水平除尘管道内沉积粉尘二次扬起形成的爆炸常会给人们的生命财产造成巨大的损失,以常见的铝合金粉尘作为研究对象,通过自主设计的水平管道试验平台、粒

期刊

粉尘除尘管道弱激波膜片粒子图像测速(PIV)系统

涂膜保鲜剂对鸡蛋壳薄斑及蛋品质的影响

本试验旨在研究涂膜保鲜剂对蛋壳"薄斑"及蛋品质的影响。选择同日产无"薄斑"海兰褐鸡蛋185个分为对照组、液体石蜡组和聚乙烯醇组,每组60个,储藏22d,每5d左右观察一次"薄斑"

期刊

蛋壳“薄斑”蛋品质哈夫单位蛋白高度

对民法典物权编中不动产登记制度的完善探讨

目前,立法机关正在加紧推进民法典各分编的编纂工作,力争在2020年全部完成民法典编纂工作。在《民法典物权编(草案)》中,除了继承原有《物权法》之外,还存在很多值得研究和关

期刊

民法典分则不动产登记公信力实质审查制度

强磁场中氢原子的能级

用Mathematica和简并微扰理论计算了氢原子第一至第六激发态（2-7）在较强磁场中的能级分裂（不考虑自旋）,并讨论了简并微扰理论的适用条件.数值结果表明：在微扰理论适用的条件下,磁

期刊

氢原子强磁场微扰理论能级分裂偶然简并

46例门诊注射室患者发生晕厥的护理体会

目的总结门诊注射室患者发生晕厥的原因及护理措施。方法回顾性分析12年6月至15年6月间在我院注射室发生晕厥的46例患者之临床资料,总结其发生的原因和护理体会。结果发生晕

期刊

注射室晕厥护理体会

不同退化程度高寒草地土壤微生物量碳特征分析

摘要为了探讨不同退化程度高寒草地土壤微生物量碳分布变化规律，在具有典型退化特征的高寒草甸与高寒草原研究样地开展野外调查，采集土壤样品，进行室内土壤微生物量碳等指标的测

期刊

高寒草甸高寒草原退化程度土壤微生物量碳

产妇分娩前的心理护理研究

产力、产道、胎儿是影响孕妇正常分娩的常见因素,但是分娩前刺激既可以产生生理上的应激,也可以产生精神心理上的应激。产妇精神心理因素能够影响机体内部的平衡、适应力和健

期刊

产妇心理护理分娩

基于实体描述属性技术的XML重复对象检测方法

其他学术论文