数据库负载自适应实时在线聚类算法的设计与实现

来源 :太原理工大学 | 被引量 : 1次 | 上传用户:sun383407949
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和信息技术的发展,数据库系统变得越来越复杂,其数据存储规模越来越庞大,管理数据库系统也变得越来越昂贵和繁琐。在传统方式下,主要是依靠系统管理员的手工调节。但这样做无法针对资源利用情况进行动态的调节;同时数据库管理员的费用也为数据库系统的维护带来沉重的负担。自主数据库系统能够自动、主动地对自身进行管理,降低了人为数据库管理的复杂度,从而降低人力成本和系统故障时带来的额外成本。因此,数据库自主技术对于提高数据库系统在关键应用中的应用能力,降低数据库系统的总体拥有成本,减少硬件、软件的投资浪费等都具有非常重要的意义。太原理工大学的牛保宁教授已经提出了数据库系统负载自适应的基本框架。该框架由负载检测过程和负载控制过程组成,负载特征化部件、性能预测部件、负载控制部件和系统监测部件参与其运作。在该框架中,系统能够根据负载的一些特性自动的完成负载的性能预测、控制等功能。在负载自适应数据库系统中,负载特征化部件是关键部分,它首先要对负载分类,然后根据分类的情况预测负载性能。本文主要研究负载的分类问题。由于负载的分类要求实时在线,所以分类必须简单快捷。因此,本文提出一种基于先验知识的增量聚类算法。本文首先介绍了该课题的研究背景,即:自适应数据库的发展和研究状况,以及数据挖掘技术的一些基本情况。接着介绍了聚类技术,包括聚类的定义,数据类型,以及聚类算法的类型和常用的一些聚类算法。然后介绍了在本文中用到的K-means算法和增量聚类算法的思路,计算过程,以及优缺点分析。最后,介绍了基于特征向量的聚类算法和基于先验知识的增量聚类算法,并用实验验证了上述两个算法的有效性。本文的创新之处在于使用了基于先验知识的增量聚类算法,该算法中的先验知识是指基于特征向量聚类算法的结果。也就是说,基于先验知识的增量聚类算法是利用基于特征向量聚类算法的结果对负载分类,而且只是对新增负载分类,不需要对所有的负载重新分类了。而基于特征向量的聚类算法是在离线的时候,系统自动完成的。当系统在线时,只须对新增负载分类。这样大大节省了时间和资源。
其他文献
光流场反映了图像上每一点灰度的变化趋势。它计算的可靠性成了计算机视觉领域面临的很大挑战,而变分方法是目前为止用来实现光流计算的最成功的方法之一。本文的研究内容之
随着互联网在国际上迅猛的发展,基于互联网的各种应用也日益受到人们的重视,特别是现代远程教育得到了巨大的发展。基于Web的考试系统正是在这种形势下应运而生的。尽管传统的
学位
传统的信息系统正演化为具有开放性和动态性的分布式系统,对于其中的多agent系统和普适计算而言,协同起着关键性的作用,而且Web服务的交互模式与Web的REST体系结构模型也不相
交换机是当今以太网中普遍而又十分重要的设备,通过交换机之间的组合,可以形成大规模、高性能的网络拓扑。现在的以太网交换机不仅用于局域网的互联,网络的接入,还运用在了骨
随着多媒体、网络技术的飞速发展,图像应用的日益广泛,基于内容的图像检索CBIR(Content Based Image Retrieval)成为当前多媒体检索研究的热点之一。该技术提取图像的颜色、
随着计算机和网络技术的飞速发展,信息安全已经成为信息社会亟需解决的重要问题之一。现代密码学作为信息安全技术的核心,在全球范围内得到了越来越广泛的重视。提供认证性、
协同GIS(Cooperatire GIS,CoGIS)是将CSCW结合到GIS中,支持一组或多组异地的用户,借助计算机及其网络技术,同时共同编辑、设计和决策基于地理信息的任务。协同GIS技术的实质
性能分析与优化一直是计算机研究中的热点。程序中执行时间最长的通常就是很小部分的热点函数和热点指令。性能分析与优化的目的就是要发现程序热点,分析瓶颈原因,选择合适的
立体图像技术的最大特点就是能够再现真实场景中的立体感。随着互联网和多媒体技术的迅速发展,立体图像处理技术逐步应用到三维视频会议系统、远程工业控制、虚拟现实、远程教