论文部分内容阅读
随着Internet技术和电子商务的不断发展,出现了一个新问题是如何通过对Web日志挖掘以发现新的有用的信息资源,这不仅是网站管理者关心的问题,更是电子商务、管理科学以及人工智能等学科领域关注的一个新的热点。企业信息网用户决策支持系统设计的指导思想是以数据挖掘技术为基础,Web服务器日志的挖掘,即通过挖掘服务器中的日志文件,获得用户的访问模式,从而进一步分析和研究用户的访问规律,来解决这一新问题。本文首先描述了国内外决策支持系统研究现状以及今后的发展趋势,介绍了数据挖掘过程、方法,阐述了关联规则的概念和Apriori经典算法和改进;然后详细阐述企业信息网用户决策支持系统的设计原则,对系统进行需求分析,设计了系统的逻辑结构和功能模块;最后,以中国国家企业信息网为背景,设计中国国家企业信息网决策支持系统,实现了主要功能。本文着重设计企业信息网用户决策支持系统的后台底层,解决的问题主要有以下几个方面:1.针对各类信息网普遍存在的Web日志挖掘问题,结合数据挖掘的技术优势,提出了本系统总体设计方案,并对系统的功能模块进行了详细的分析设计。2.根据系统的需要开发设计了系统的数据库子系统,模型库子系统,方法库子系统三个部分,并闸述了用户浏览行为的URL-User ID关联矩阵表示方法,建立了基于URL-User ID关联矩阵的Web页面聚类模型、Web用户聚类模型。3按照企业信息用户决策支持系统设计,开发出中国国家企业信息网决策支持系统。系统主要做了两方面的内容:一是对网站的访问信息的统计,如日访问量等;二是利用Apriori算法对其进行数据挖掘,来发现隐藏的用户访问的路径和规则。企业信息网用户决策支持系统设计是针对普通网站提出的,中国国家企业信息网决策支持系统是它的实际应用,系统在应用中具有良好的可扩展性和重用性。本文在此仅作了初探,在实际应用中还需进一步的开发和完善。