基于最大流及页面相似度的Web结构挖掘

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:ee320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Web结构挖掘算法容易出现“主题漂移”以及主机间的多重互相加强关系的问题,提出了一种基于最大流与页面相似度值的超链接结构挖掘方法。该方法在传统的超链接结构挖掘算法HITS的基础上引入页面相似度值构造邻接矩阵,并结合基于最大流的Web社区发现技术来构建特征向量空间模型,通过迭代计算最终获得价值最高的权威结果集和中心结果集。实验结果证明该方法有较好的查准率与查全率,并有效抑制了“主题漂移”现象,具有一定的实用价值。
其他文献
在2012年4月开始的滨海新区教坛能手培训活动中,我从孙立仁教授那里学到“以学习心理学为基础的启发式教学设计”和“以科学思想方法为基础的探究式教学设计”的理论与方法,为
复杂反应动力学建模中,系统参数的优化是需要解决的关键问题之一。该类优化问题具有多参数、非线性以及参数相关性强等特点。协同进化算法将多种群之间的协同作用以及种群内
随着我国体育事业的蓬勃发展,各体育项目也逐步走进中小学校园,虽然我国足球的现状不太理想,也是处于稳提升阶段。要想提高足球运动水平,青少年这支年轻而富有朝气的队伍是最关键