基于Web的图像数据挖掘研究与应用

来源 :山东大学 | 被引量 : 0次 | 上传用户:Tianzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
WWW是一个开放的全球性资源,它是世界上最丰富和最密集的信息来源。随着WWW上信息的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术最重要的应用。因此,采用数据挖掘技术从WWW上提取隐含的、未知的、非平凡的及有潜在应用价值的信息,具有十分重要的现实意义和广泛的应用前景。数据挖掘和知识发现为解决信息量过大而人们无法有效利用的问题提供了新的解决途径。目前,数据挖掘和知识发现的数据源主要是已有数据库中的文本和数值类数据,如何对分布于网络环境下的图像数据进行挖掘还未有充分研究。本文首先简单阐述了数据挖掘和知识发现的基本理论;分析了网络信息检索与挖掘的特征,特别是Web数据挖掘和基于内容的图像检索;进而探讨了基于Web的图像数据挖掘研究与应用的一系列基本问题,包括定义、挖掘对象的特征与分类、挖掘和发现所需的理论和技术以及系统的框架结构和功能模块的分析与设计等,力图为该方向的深入研究提供一些有益的思路。本文还研究了基于内容的图像检索技术(CBIR)的特点和方式,CBIR技术主要依据图像的画面内容特征和主题对象特征来进行检索;讨论了图像的颜色、纹理、形状、空间关系等方面的特征;提出了目前图像挖掘的主要技术,包括分类、聚类、关联规则和神经网络;总结了图像数据挖掘的重点和难点在于特征的提取和图像的表示方式、图像的比较策略、机器学习和图像的自动标注、检索系统的评价标准等几个方面。结合基于Web数据挖掘的方法和基于内容的图像检索,本文对WWW上的图像信息挖掘和检索系统进行了一些研究和探索,分析了Web图像搜索引擎的原理、图像分割方法和MPEG—7标准,为实现本文所设计的实验系统打下基础并构建了一个框架。通过上述内容的分析和研究,构建本文所设计的基于Web的图像数据挖掘的实验系统,首先分析了系统所需功能,为系统的实现打下理论基础,提出了多维数据立方在图像数据挖掘中的具体实现方法,针对图像数据和复杂性,简化了多维数据立方结构;采用最大出现次数算法,提高了系统计算规则的速度,设计了一个较为完整的实验系统模型,绘制了各功能模块的框图,给出了一个简化的Cdib类代码,并在系统中引入了徒手绘草图方法,试图增强系统的适用性。
其他文献
目的:观察敛肺止咳、活血止血类中药治疗支气管扩张咯血的临床疗效。方法:分别采用自拟中药汤剂田七宁血汤(田七粉、百部、百合、白及、贝母、紫菀、冬花、白芍、大枣等)配合
米糠是一种营养好且廉价的饲料原料,目前已经被大部分营养专家所认识。米糠具有营养好价格低廉的优点,是一个比较好的饲料原料,它能降低饲料成本,提高经济效益,是一个极具开
公正审判是各国刑事审判制度的最佳价值选择,也是人类历史以来,关于法院审判问题中的一个永恒的话题。因为审判是否公正,怎样才能作到公正审判,所涉及到的理论和实践问题是极
首先讨论了永磁同步电机的结构、3个坐标系下的数学模型及其变换方法,实现交流电机多变量及其相互作用的解耦,将交流电机化简并等效成直流电机来进行分析.然后基于TMS320F281
为了解杀虫气雾剂产品掺入二甲醚的情况,对流通领域50个批次的杀虫气雾剂进行了二甲醚检测。检测结果显示:有6个批次杀虫气雾剂产品检出二甲醚,检出率为12%。杀虫气雾剂产品
闻名遐尔的淳安千岛湖拥有优越的自然条件、巨大的经济潜能和得天独厚的旅游资源。而杭州城市东扩、旅游西进的城市发展战略的实施使得淳安千岛湖房地产业的发展更具潜力。论
文章采用文献资料法、调查法、数理统计法、逻辑分析法等研究方法,以福州大学城六所高校的体育场馆为研究对象,对其资源利用的现状进行调查研究。调查研究结果显示:福州大学
目的 :探讨家属培训对精神分裂症患者服药依从性的影响。方法 :本研究采用前瞻性研究设计和随机对照方法。选取社区42例精神分裂症患者及其家属将患者随机分成研究组和对照组