一种相似重复记录检测算法的改进与应用

来源 :成都工业学院学报 | 被引量 : 0次 | 上传用户:jigmei123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍数据清洗与相似重复记录检测算法的相关概念以及相似重复记录的清洗原理。对基本近邻排序算法SNM进行了深入分析和研究,指出其中的不足,在此基础上给出改进策略并加以应用。实践证明:该改进算法在关键性能上有明显改善。
其他文献
目的探讨两种不同类型靶向药物在不同给药模式下对转移性结直肠癌(mCRC)患者生存的影响。方法回顾性分析135例接受过分子靶向治疗mCRC患者的临床病理特征、靶向治疗情况及随访
目的:分析髋臼周围肿瘤切除联合髋关节复合重建术的疗效,为髋臼周围肿瘤的治疗提供临床依据。方法2001年5月至2010年5月收治24例髋臼周围肿瘤患者,完全切除肿瘤后采用人工全髋关
目的探讨黏蛋白4(MUC4)在胰腺上皮内瘤变(PanINs)和胰腺导管腺癌(PDAC)中的表达及临床意义。方法收集2009年3月1日至2011年12月31日第二军医大学附属长征医院的胰腺组织蜡块标本共8