Web日志的高效多能挖掘算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:RIshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对Web服务器日志文件和客户交易数据进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径.提出了一种新颖的Web日志挖掘算法.在该算法中,首先以Web站点URL为行、以UserID为列建立URL-UserID关联矩阵,元素值为用户的访问次数,然后,对列向量进行相似性分析得到相似客户群体,对行向量进行相似性度量获得相关Web页面,对后者再进一步处理还可以发现频繁访问路径.实验结果表明了算法的有效性.
其他文献
在代理签名方案中,代理签名人可以代表原始签名人生成签名.然而,在已知的各种代理签名方案中,代理签名人生成的每个代理签名都只代表一个原始签名人.有些情形需要一个代理签名能
产地检疫是指动物、动物产品出售或调运,离开饲养、生产场之前,由动物检疫员到场到户或到指定地点的检疫。是防止染疫动物及其产品进入流通环节的关键措施。也是把疫病消灭在产