论文部分内容阅读
随着科学技术的快速发展,越来越多的领域采用信息技术进行数据管理,与以往的数据处理相比,简化了操作,提高了工作效率。然而,随着信息化的不断推进,数据的存放日益分散且形式多样化,导致“信息孤岛”现象出现,严重地阻碍了信息化建设的整体进程。由于基于不同本体的信息系统在信息交换时必须能够互相理解,在此需求下产生了本体映射技术。本体映射技术源自于异构数据库间的模式映射技术,经过多年的研究已经取得了很大的进展,但仍然存在映射启发信息少、准确性低以及自动化程度低等问题。本文在对当前异构数据集成和本体论的相关研究背景进行分析的基础提出了基于本体映射的方法来进行数据集成,从而更好地的解决异构数据集成中的异构性和语义冲突。在该方法中,利用混合本体构建模式通过映射建立彼此间的对应关系,实现异构数据的共享。本文的研究内容主要包括:(1)提出了基于本体映射的属性映射方法及其概念映射集成技术。针对目前的本体映射的研究主要集中在概念映射,即通过映射找到两个本体概念间的对应关系,导致分析结果不全面的情况,提出了基于本体映射的属性映射方法,以及概念映射方法与属性映射方法的集成技术。该方法利用了概念相似度和概念的属性相似度计算方法,通过A*算法选取合适的分量权值形成多语义相似度计算方法,最后根据此方法来发现本体间的映射关系。多语义相似度方法与之前的方法相比更加全面地放映了本体间的语义关系,从而更好地为本体映射服务。(2)提出了一种半自动化的全局本体构建方法。由于目前无法实现完全智能化地实现本体之间的映射,因此,本文引入了局部本体之间的相似度计算,通过前面提出本体相似度的计算方法,来为提取全局词汇提供一个可能匹配的候选结果列表,提高了全局本体构建的成功率及效率。(3)将基于本体映射的异构数据集成框架成功地应用到了现代数字社区信息集成中。在对目前已有的异构数据集成架构进行分析之后,选择中间件的模式集成,在此基础之上给出了基于本体的异构数据集成系统架构设计,利用JAVA和protege本体开发工具对关键模块进行了实现。本文研究表明,通过利用多种映射方法,将概念、属性等多种可用信息进行综合处理,在映射中运用机器学习等方法,能有效改善本体间自动映射的效果,减轻人工映射的工作量。