论文部分内容阅读
随着数据仓库和web技术的迅猛发展,人们对数据仓库和web技术的研究越来越广泛,数据仓库系统设计得是否合理,将直接关系到整个数据仓库系统的成败。在分析web技术与数据仓库体系结构的基础上,将XML、web挖掘技术引入到数据仓库中,构建了一种基于Web方式的分布式数据仓库体系结构。 基于Web的分布式数据仓库系统的创建是一项既具有挑战性又有益的工作,与传统的数据仓库相比,具有界面友好、使用方便的优点,并且还可将企业分布在各地甚至全球的子公司、客户及企业外的数据库资源合理的引入到数据仓库中,为企业提供更有力的决策支持,大大提高企业的经济效益。 本文在对数据仓库和web技术相结合研究的基础上,重点从应用角度设计和开发基于web方式的数据仓库中的关键问题。在此基础上提出了一种基于Web方式的分布式数据仓库体系结构。本文构建的基于Web的分布式数据仓库体系结构可大大减少数据传输过程中网络流量,合理实现异构数据源的数据集成,为数据仓库的开发起到一定的抛砖引玉的作用。文中详细分析了web数据的特点,以及XML、web挖掘技术,并且将数学方法应用于数据挖掘,建立了一种模型,改进了一种数据挖掘算法,提出了一种混合策略,并实现了部分算法。 本文是按以下顺序组织的:第2部分简要介绍了数据仓库技术。第3部分说明了基于web方式的数据仓库系统的组成并讨论了该数据仓库特点和实现方式。本文的第4部分与第5部分讨论了数据仓库系统的设计和系统实现过程中的关键技术,这是本文的重点。最后一章是对本文的总结并提出了对基于web方式的数据仓库需要进一步讨论的问题。