电子政务信息集成中本体的自动生成技术

来源 :山东大学 | 被引量 : 0次 | 上传用户:surezheng12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息网络时代的到来给国家政府部门的工作提出了快捷、高效的要求,发展电子政务已是大势所趋。但是目前的电子政务系统在面临着很多问题,其中一个主要的难题就是信息源异构问题,信息集成技术就是研究异构数据之间的集成问题,它将这些孤立的数据都集成起来,并且提供给用户一个统一的视图,使用户有可能从巨大的数据资源中获取所需的东西。 在对多异构分布自治的信息源的集成中,我们首要解决的就是这些数据源之间产生的语义冲突。其中这些冲突包括由不一致数据和对相同数据的多个解释造成的数据级冲突和由数据的逻辑组织不相似所造成的模式级冲突。我们引入本体的概念来解决这些语义冲突问题。 本文我们提出了应用本体技术进行面向语义的信息集成的电子政务系统模型EGⅡ,我们以劳动和社会保障部门为背景,实现异构数据源的信息集成。在本模型中,本文重点探讨了它的核心部分——本体的自动生成技术。 本文提出了SFCA(带同义词判定的形式化概念分析)(Synonym Formal Concept Analysis)算法,它对FCA方法进行了改进。算法根据属性在概念中的重要性对属性赋权值,利用属性的权值计算两个概念的相似度,比较相似度和相似阈值的大小,最终确定两个概念是否是同义词关系。算法改造了FCA方法中的关联矩阵,未增加新的数据结构,在分析出概念的普通关系的同时,分析出符合领域习惯的同义词关系。 本文还设计了根据概念格生成本体的算法OAG。它在SFCA算法生成的概念格与本体的类之间的建立对应,并利用这种对应关系由格生成本体。由于SFCA算法分析出了概念之间的同义词关系,使得最后生成的本体语义信息更加丰富。 本文提出的本体的自动生成技术与手工方法建立本体相比提高了效率,减少了错误的发生。与其他的本体半自动、自动生成技术相比,在基本不增加复杂度的情况下,生成的本体语义信息更加丰富。
其他文献
软件自动化测试已经广泛应用于通用软件测试领域,并已经有了诸多成型的理论、实施规范和商用化的工具。而在嵌入式领域,由于嵌入式系统缺乏通用的软硬件平台,系统的功能和应用环
随着Internet技术的飞速发展,人们越来越多地依赖网络这个巨大的知识平台。作为用户利用网络信息的重要接口,搜索引擎的发展自Web诞生之日起就一直没有停息。同时,计算机的日益
随着全球化竞争的日益加剧,尤其是在资源有限的情况下,企业要获得持续性发展,就必须充分地利用外部力量,以求有效塑造自身的核心竞争力。企业通过开展外协业务来共享制造资源、共
随着Internet技术的持续发展,越来越多的图像、声音、视频等多媒体信息在计算机系统中被广泛的使用,从网络可获得的多媒体信息的数量越来越多。因此,需要有一种相对完美的检索方
随着生物技术的发展,许多致力于研究物种基因的项目已取得了很大的成就。大量的物种引起了人类浓厚兴趣,如果能加快序列处理技术的发展,就能从许多新的序列中发现更多的特征
当前Internet 在全球范围内不断发展,应用日益广泛,越来越多的企业或机构将自己的内部网络与Internet 相连,以共享Internet 上丰富的资源,并且向外发布自己的信息,但由此也带
块效应是视频编码(尤其是低码率视频编码中)长期存在的干扰因素。这首先是由于视频编码中的分块运动估计,其次是由于运动估计后的变换和量化。而这两种是现有主流视频编码标准中
随着互联网的普及和经济全球化的推进,信息系统在人们的生活、学习和工作中逐渐开始扮演着越来越重要的角色,人们对信息系统的依赖性也越来越强。许多的信息系统处于不设防或
近年来,随着互联网和无线网络技术的飞速发展,移动商务作为电子商务领域发展的新方向显示出巨大的潜力,同时也使网络信息安全问题日益突出。解决网络信息安全问题,密码技术是
二十世纪蓬勃发展起来的智能算法为解决复杂优化问题提供了有利工具,在各个领域获得广泛应用。但是,智能算法种类多、待优化问题门类杂,如何在改善算法自身的同时,理清待求解问题