论文部分内容阅读
该文从信息组织的角度,分析了目前最流行的管理网络信息查询工具—搜索引擎的工作机理,并重点研计了其在信息采集、文档处理和用户检索过程中所涉及的组织技术与方法.该文首次提出了判断网页"重要性"的五个指标(与查询请求Q的相似度,向后链接数,PageRank,向前链接数和位置指标);并用实例分析了指标性能的优劣;分析了Web文档与传统文献的差异;详细剖析了Web文档的索引结构,有助于国内的ICP代鉴参考.