基于机器学习的深层网络接口模式匹配方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:yingying0615
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着万维网快速发展,深层网络中蕴含的信息日益增加。由于深层网络具有规模大、异构性、自治性等特点,如何使用户高效、快捷地获取自己满意的信息面临挑战。为了解决这一问题,需要对深层网络查询接口进行集成。深层网络查询接口集成包括若干步骤,但其中至关重要的一步是接口间模式匹配。只有实现了该匹配过程,才能对查询接口模式进行集成,最终得到一个全局查询接口。用户在全局查询接口上提交所要查询的信息,屏蔽掉与搜索无关的细节,得到最满意的查询结果。本文主要研究深层网络接口模式匹配问题,深层网络接口模式匹配的目的是找到局部查询接口之间的属性或是局部查询接口与全局查询接口之间的属性的最佳匹配关系,以解决查询接口之间存在的同名异义或异名同义的现象。目前解决深层网络查询接口模式匹配的方法有很多,现有的方法大多是针对局部查询接口之间的模式匹配进行研究,并且忽略了深层网络本身的特点。本文针对局部查询接口与全局查询接口之间的模式匹配进行研究,同时利用了深层网络的特点,提出了基于机器学习的深层网络接口模式匹配方法,该方法把模式匹配问题转化成了机器学习中的分类问题。本文使用集成学习中的多策略学习技术,研究已经证明多策略学习技术比单一的学习器准确度要高。同时,本文为了增强匹配的准确度,在训练阶段和匹配阶段均引入领域本体的概念,丰富了属性的匹配信息,提高了匹配的准确度。除此之外,本文考虑到查询接口中往往包含丰富的结构信息,为了充分利用层次结构树信息,提出了一种新的学习器算法,该过程能够有效的纠正了前一个阶段的匹配结果,使得匹配准确度进一步提高。为了评估基于机器学习的深层网络查询接口模式匹配的执行情况,本文分别以图书销售领域和航空订票领域的120个数据源作为训练集,40个数据源作为待匹配模式集进行实验验证,实验结果表明,该方法有较高的准确度。
其他文献
近年来,进化多目标优化(Evolutionary Multi-objective Optimization,EMO)算法研究逐渐成为进化计算研究领域的一个重要内容。EMO算法一次运行就可以获得一组具有代表性的Par
移动机器人由于行动灵活、完成复杂任务能力强,在当今社会应用越来越广泛。移动机器人的自主导航功能,作为移动机器人是其最基本、最重要的功能,一直以来都被各领域研究者所关注
随着数据挖掘技术在各行各业的广泛应用,人们对这一领域的相关技术越来越关注。数据聚类和社区发现是数据挖掘领域中十分重要的两个课题,它们之间也有一些共性。聚类是指将数据
随着全球经济的飞速发展,现代物流服务已成为世界各国促进产业结构调整、转变经济发展方式和增强国民经济竞争力的重要手段,也是国家现代化程度和综合国力的重要标志,因此对
传统的基于文本的图像检索存在耗费人力、信息不完整、歧义性等问题,促使了基于内容的图像检索的出现。基于内容的图像检索分为基于全局特征的方法和基于局部特征的方法。基
网络流量分类技术是互联网运营商对网络状况进行监督,进而对网络进行管理的重要手段。随着互联网技术的快速发展,在不增加网络带宽的情况下提升网络的性能成了亟待解决的问题。
随着GPU体系结构的发展和GPU编程模型的成熟,越来越多的应用程序采用了高性能GPU架构来开发。NVIDIA公司提出的CUDA编程模型,已经在业界取得了巨大成功,引起了学者们的广泛研究
随着互联网的迅猛发展和普及,宽带流媒体技术的出现,视频点播(Video on Demand,简称VOD)业务已经成为当今互联网的主流业务之一。传统视频点播系统基于客户端/服务器架构,虽然可控
多核处理器是处理器的发展趋势,根据系统的内核结构是否存在差异,多核处理器可分为同构多核和异构多核。同构多核存在一定的局限性:在系统达到极限值之后,性能就无法随着内核