【摘 要】
:
随着信息技术的发展,数据量呈现爆炸式增长,传统的单点聚类计算已经远不能满足需求。将大批量的数据分配到数以千计的集群节点中进行分布式计算的方式在大数据环境下对提高聚
论文部分内容阅读
随着信息技术的发展,数据量呈现爆炸式增长,传统的单点聚类计算已经远不能满足需求。将大批量的数据分配到数以千计的集群节点中进行分布式计算的方式在大数据环境下对提高聚类效率有着非常重要的意义。本文主要研究了分布式环境下聚类算法的实现和应用,分别利用二维图像数据和三维模型数据对算法进行验证并对算法的执行效率和聚类准确性进行分析和评价。首先,研究了分布式聚类算法在图像分类领域中的应用。针对手写数字识别问题中手写数字图像特征量大、传统聚类算法效率较低的问题,将传统K-means聚类算法在Hadoop分布式计算平台中实现,提升聚类算法运算效率。另外,对于K-means聚类算法的K值以及初始聚类中心的确定问题引入Canopy算法进行优化,同时通过“最大最小化原则”确定Canopy算法中的T1、T2阈值,从而提高了手写数字识别的准确度。其次,将本文提出的分布式聚类算法应用于基于视图特征的三维模型检索领域。为了实现三维模型特征提取,将三维模型不同视图转化为二维图像并提取二维图像的SIFT特征,借助自然语言处理领域中的词袋模型思想对SIFT特征标准化以降低噪声点对特征的影响,通过分布式K-means聚类算法获取三维模型视图特征向量并实现三维模型检索,在模型检索精度和检索时间效率方面能够达到较好均衡。
其他文献
实践教学是培养学生实践创新能力的主要途径,对于创新型应用人才的培养具有重要作用。天津工业大学电子与信息工程学院针对实践教学现状,以培养创新型应用人才为目标,引入OBE
农村地区的党的基层组织建设是党在农村执政的关键,是党联系广大农村地区人民群众的桥梁和纽带之一,现阶段,农村地区基层组织建设的问题也尤为突出,包括:基层党员选拔家族化
随着现代工程系统结构复杂化,使用环境趋于严酷和恶劣,要求持续无故障工作时间加长,客观地要求系统的效能越来越高,迫使人们设计系统时,把可靠性作为主要内容之一。为推动输弹机可
本论文首先分析了外差式连续波多普勒引信及锯齿波调频测距引信的原理和系统组成。在此基础上,建立了系统信息处理模型,形成了无线电引信信息传递、信号处理、启动特性的数学模
11月30日,在埃塞俄比亚召开的联合国教科文组织保护非物质文化遗产政府间委员会第11届常会经过审议,批准中国申报的“二十四节气——中国人通过观察太阳周年运动而形成的时间知
教学理念是一个教师教学思想和教学行为的高度概括,同时也是教师教学风格的具体体现。作为中学历史特级教师和教授级中学高级教师,束鹏芳教学理念的形成和发展在中学历史教师中是比较具有代表性的。一个教师教学理念的形成与其教学实践和教学研究有着密不可分的关系。在大港中学的教学实践和教学研究的过程中,束鹏芳始终坚持探究更适合学生心理认知发展的教学方法,授课模式以及教学理念。结合社会文化理论和建构主义理论,束鹏芳
漫画作为一种特殊的艺术表现形式,在青少年群体中一直有着较高的关注度。近年来,互联网发展迅猛,我国进入了互联网+时代。手机、平板电脑等移动端设备在?们的生活中逐渐得到普及,人们的阅读习惯也因此而发生了改变。至此,移动端漫画应运而生,对传统漫画产业产生了巨大的冲击的同时也带来了新的挑战和机遇。分析、理解和把握互联网移动端的发展与移动端漫画的关系对整个漫画体系的发展与繁荣具有重要意义。移动端漫画是本论文
近年来,二维材料由于其出色的光电学性能逐渐成为了研究的热点领域。从层状石墨烯的出现开始,人们又发现了众多性能迥异的二维材料,这其中,过渡金属硫族化合物是其中的一个大
作物病害是限制农业生产的主要原因之一。通常植物通过两种途径来抵御病害,分别是基础抗性(PTI)和基因对基因抗性(ETI),其中在ETI途径中发挥主要作用的就是抗性基因(R基因),
垂直圆管作为换热介质的载体已被广泛地应用于工业界中的换热设备中。例如,太阳能发电站能量接收装置的换热载体之一就是垂直圆管;当汇集的太阳辐射作用在圆管壁面上时,可产生壁面与管内流体的热量交换,而受热流体可发生自然对流流动,且流体流动会把获得的热量带走。由于垂直圆管内这种对流和换热的广泛存在,开展相应的研究有其重要的基础研究价值和工程实践意义。本文采用尺度分析方法研究了垂直圆管内自然对流的动力和传热机