基于主成分分析和粗糙集的聚类分析在经济指标数据中的应用

被引量 : 0次 | 上传用户:boyskys
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
《中国统计年鉴》是国家统计局出版社出版的一部具有权威性的统计性数据书籍。该书主要统计中国的各项数据,包含有人口、能源、经济等多方面反映中国社会现状的数据信息。通过这些数据信息可以从宏观上了解中国的经济状况,从而总结过去的经济状况,同时对未来的经济也提供依据。本文主要针对《中国统计年鉴2010》中的第十一部分:城市概况。全国的省会城市加上计划单列市总共36个城市,针对这36个城市列出22项经济指标,本文即对这36个城市的经济指标进行研究,根据这些经济指标将36个城市聚类。在数据挖掘中,聚类分析算法是一种常用的数据分析方法,使用聚类分析可以更好地研究数据信息,从而提取出对人们生活有利的信息。聚类分析在生活中有着广泛的应用,通过聚类分析可以使得物以类聚,属于同一类的对象有着相同或者相似的性质。主成分分析是一种用于降维的算法,针对本文22个经济指标的高维数据,使用主成分分析将样本数据进行降维处理。粗糙集中上近似集和下近似集的思想可以解决聚类分析边界不清晰的问题。基于将主成分分析、粗糙集和聚类分析相结合的思想,本文提出一种聚类模型,该模型利用主成分分析的思想进行降维,利用粗糙集的思想计算上近似集和下近似集,从而解决传统聚类方法中边界不清晰的问题。该模型将主成分分析和粗糙集的思想用于聚类分析,即将主成分分析、粗糙集和聚类分析三种方法结合起来,研究中国统计年鉴中的数据,进行聚类。具体方法为:先将数据进行主成分分析,之后利用基于粗糙集的聚类算法进行聚类分析。该聚类模型包括以下步骤:(1)将经济指标数据即含有22个经济指标的36个城市样本数据进行主成分分析,达到降维的目的。(2)将(1)数据进行基于粗糙集的聚类分析,得到上近似集的聚类中心和下近似集的聚类中心,并且得到聚类分析后的聚类结果,包括聚类中心、聚类的上近似集和下近似集。(3)将本文提出的聚类模型得到的结果与传统的聚类分析方法相比较,分析主成分分析和粗糙集带来的优势,从而验证该聚类模型的有效性。
其他文献
本研究基于对2 300名学生调查的数据对生活方式6个下位因子解释健康总方差的能力进行了评估,分层回归的结果发现,人口统计学变量、药物及烟酒、卫生习惯三类变量解释健康总方
目的:对银黄口服液的处方配比及提取物精制方法进行研究。方法:以体外抗金黄色葡萄球菌效果为指标对银黄口服液的处方配比、金银花提取物精制方法及精制后与黄芩提取物的最佳
糖尿病足介入治疗的患者存在年龄大、合并症多并有对比剂的应用等情况,故围手术期有其复杂性;本文查阅了近年来国内外文献,进行整理、分类、比较、分析,对于糖尿病足介入治疗
为改变传统的管线外业调查流程,将探查和测量合为一步,实现数据采集的数字化,降低地下管线外业调查的复杂度,提出将PDA用于地下管线外业记录的研究思路。首先根据系统需求分
石墨烯是单层碳原子以六角形蜂窝状排列的二维材料,具有独特的物理化学特性。石墨烯的比表面积、迁移率和透光性都比一般材料高,机械强度大、导热性也颇为优异,因此在各个领
远程抄表系统在工业控制领域中有着十分重要的意义。目前我国许多工业场合,尤其是对于一些分散的、无人值守的用电现场,需要对电量信息进行定时采集。传统的抄表系统要么需要
目的:探讨中晚期中央型小细胞肺癌的CT征象与中医辨证分型之间的相关性,为中医治疗肺癌的辨证分型提供客观依据。方法:收集2009年12月至2011年12月经手术或活检病理确诊的60例
应用人体测量法和运动干预实验方法,通过对弹力带阻抗健身体操运动方案的分析,探讨"有氧、力量和伸拉"练习的可兼容性,研发新颖有趣的弹力带健身方法,并实证其健身效果,旨在
<正> 肺癌的介入治疗,主要是指以支气管动脉灌注抗癌药物。术中常采用手推法将2~3种分别溶解的抗癌药液逐一注入插进靶血管的导管内。在推药过程中,患者常有喉部烧灼感,刺激性
随着政府的管理成本意识、服务意识和公民意识的加强,绩效评估逐渐在政府管理的实践中得到应用。西方一些国家于上世纪七十年代开始实施政府绩效评估的尝试和探索,进行了大量