【摘 要】
:
在多个Web主题爬虫并行爬行中,如何避免重复访问网页并高效地获取与主题相关网页,成为搜索引擎主题爬行的热点研究内容之一。为完成系统爬行任务充分发挥每个爬虫自身能力,文
【基金项目】
:
国家自然科学基金(60872089,61271413)
论文部分内容阅读
在多个Web主题爬虫并行爬行中,如何避免重复访问网页并高效地获取与主题相关网页,成为搜索引擎主题爬行的热点研究内容之一。为完成系统爬行任务充分发挥每个爬虫自身能力,文章立足于每个爬虫相对独立爬行、共同协作、彼此竞争的思想,将爬虫的历史爬行网页作为背景知识,分析这些网页文本内容,提取网页中"概念"和概念间的语义关系,探讨不同爬虫背景知识之间的语义相似性,提出基于分层概念背景图的爬虫之间理解方法、协作和竞争策略。该策略包括4个方面的内容:主题爬虫背景知识的分层概念背景图的表示模型、基于分层概念背景图的爬虫语义理解方法、在语义理解模型下同组多个网络爬虫之间协作与竞争机制及实现、在语义理解模型下异组多个爬虫之间协作与竞争机制及实现。
其他文献
本文针对所在专业课实验室的特点,指出了专业实验室在教学、科研和科技开发中的优势,同时阐述了目前专业课实验中存在的问题,探讨了解决这些问题的对策,指出实验项目的调整、
孕妇情绪的好坏与胎儿发育密切相关,孕妇长期处于忧虑的精神状态,可造成胎盘血液循环不良,影响胎儿发育。而孕妇的恐惧、紧张情绪又会使血管痉挛,产生高血压,诱发妊高征的发
将企业作为一个整体对其价值作出评价,多出自并购重组的目的,本文站在有并购动机的企业角度,对目标企业的产业、定位、分析与评价作出有益的探讨,供参考。
化工园区混合污水成分复杂,难降解污染物含量高、水质波动大,对其进行处理并达标排放具有很高的难度,目前应用前景较为广泛的是臭氧氧化深度处理工艺,因此,本文通过制备新型
目的:为了使住院孕产妇的健康教育规范化,满足大多数贫困农民孕产妇、家属对保健护理知识的渴求。方法:根据病人的生理、心理、职业、文化程度、社会经济条件、性格等特点,提供适
摘 要 目的:总结高龄前列腺摘除术术后治疗经验和护理体会。方法:对80例高龄前列腺摘除术的患者进行治疗和护理的质量跟踪,并分析总结护理方法。结果:全部患者手术均获得成功,住院期间出现的并发症均得到了较好控制。结论:高龄前列腺摘除术术后正确的治疗、合理的饮食、正确的基础护理和心理疏导,这些措施可使患者积极配合手术及护理,减少治疗和护理意外的发生,使手术成功率提高。 关键词 前列腺摘除术术后 高龄