一般分布区间型符号数据的SOM聚类分析研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:lollipop1910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展和信息化进程加快,社会的数据量呈现爆炸式增长,给传统的数据挖掘和分析技术带来新的挑战。符号数据分析技术(SDA,Symbolic Data Analysis)基于“数据打包”的思想针对海量数据的处理提供了一套知识发现和规律挖掘的理论方法。区间型符号数据是SDA中最常见的一类符号数据,应用也最为广泛。聚类分析作为一种无先验知识情况下对复杂数据关系进行分析处理的技术是数据挖掘技术的一个重要的研究分支,并在符号数据分析领域有着广泛的应用。源自神经网络的自组织映射(SOM,Self-Organizing Map)方法由于其拓扑保序和可视化等特点在聚类分析中有其独特的优势。现有的对区间型符号数据聚类分析的研究,多建立在打包构成区间数的原始数据服从均匀分布的假设的基础上,但实际情况往往不能满足这一理想假设。针对此问题,本文考虑放松原始数据分布的假设,针对一般分布的区间型符号数据的表示方法和距离度量以及在SOM聚类分析中的应用展开研究。首先给出了符号数据的基本概念,重点介绍了区间型符号数据的descriptive statistics,基于一般分布的假设,区别于传统均匀分布假设的区间数,给出了一般分布区间数的定义和特点概括。考虑区间数(Interval)中所包含的个体的分布(distribution of individuals)信息,本文提出了一般分布的区间型符号数据的一种新的表示方法,并阐述了与传统均匀分布的区间型符号数据的表示方法之间的联系与区别。在区间数的新的表示方法的基础上,基于传统的city-block距离给出了一般分布区间型符号数据的距离度量。并基于该距离度量给出了一般分布区间型符号数据的SOM聚类算法。随机模拟试验的结果表明,基于一般分布假设并采用本文提出的表示方法和距离度量的SOM聚类算法的有效性优于基于均匀分布假设并采用传统Hausdorff距离度量的SOM聚类算法。最后将本文提出的聚类算法在我国的气象数据集上做了应用研究,进一步说明了本文算法可以有效地解决实际问题,具有一定的实用价值。
其他文献
在当前数据模式识别理论和方法研究的基础上,针对在无监督聚类和有监督分类两种识别方法在独立用以进行样本分类,特别是给无类标志样本分类时存在的不足之处,提出了一种先聚
当钟声拂过岁月的年轮,  当欢庆的歌声灿烂成初冬的暖阳,  我们齐声欢呼,我们高声歌唱:  宝鸡市特殊教育学校,我亲爱的学校  祝您生日快乐!  多少辛勤的汗水,曾经在这里挥洒;  多少激情的梦想,曾经在这里飞扬;  今天,请允许我翻开这美丽的画卷,  虔诚地聆听您的倾诉,回溯您流光溢彩的漫漫征途。  2013年12月16日渭水之畔,城郭之北  您呱呱坠地。  这是一个“生命”的诞生,  是一份力
期刊
论文以消费者个人信用为研究对象,从信用的起源与演进出发,对个人信用理论的发展进行了全面概括与总结,并给出了新的界定.论文重点对个人信用评估进行了研究,阐述了构建个人
作者简介:杨赫怡(1993.4-),男,汉,云南昆明人,硕士研究方向:文学与文学翻译。  今晚,已经是我躺上病榻的第99天,上天真是会开玩笑,就在我奇迹般地充满活力时,一纸死亡通知书又把我拽入了低靡的状态——我可能活不过明晚。遗愿清单越列越多,我要花好长一段时间才能逐一回忆起呢。已经凌晨两点半了,我的遗愿清单还在脑海里飞来飞去,真该死,它们已经缠绕成一团,凌乱不堪,就算我的大脑再活跃,也理不清这些
期刊
有这样一个故事:如果我要出售一只每天下一个金蛋的鹅,此时我会保证你得到的收益高于把钱存在银行里得来的利息。在协商你愿意给我出的买价和我愿意接受的卖价的时候,你的合理的预期是这只鹅仍将以同样的速度下金蛋。结果这只鹅一到你家,金蛋产量下降到每周一只。这使你成为一个惨败者。它仍是一只很不错的鹅,因为你仍有收益,虽然下降了很多。你可以满足于这种下降的收入,也可以将其卖给第三方。鹅的新主人能够获得你现在的投
论文首先分析了论文研究的背景,指出客户智能是企业建立基于知识的竞争优势中必不可少的一环,它也是企业以客户为中心发展策略的必然要求.论文的第二章综述了当前客户智能、
作者简介:崔婧妤(2001.11-),女,原籍湖北秭归,现就读于成都外国语学校高1(12班)。  母亲是今年夏天生的病,令人遗憾的是她患上这种病过后越来越老了,不过年轻时当教师的那种素养还在她身上无可救药地保留,所以她行为举止都还很优雅。秋天快要过完的时候,我才实现了夏天对她的允诺,带她去一个有山水可观的地方,希望能在那里陪她度过剩下的时间。我们住进山脚下的一间复式平房,对于两个人来讲显得不大也不
期刊
作者简介:张德铭(1996.4-),汉,湖南人,本科,北美洛杉矶华文作家协会会员,研究方向:文学。  前不久,我品读了一篇文章,文章讲述的是张英“六尺巷”的故事。张英,是康熙年代的一个重臣。他是安徽桐城人。张英早年就中了进士,后来在康熙那里,官做到大学士。  有一年,他的桐城老家那边来人说,他们家要修建房屋,与隔壁邻居家一个姓吴的穷秀才家,因宅基地发生了矛盾。张家与这家邻舍本来有过契约,规定两家墙
期刊