【摘 要】
:
随着大数据的发展,数据包含的信息价值越来越丰富。如何对大数据进行快速的检索,成为大数据处理的迫切需求。因此,Lucene、Solr、Elasticsearch、Sphinx、Xapian等开源搜索引擎便应运而生。其中分布式全文检索引擎Elasticsearch以其近实时、全文检索、高可用、易部署、接口友好等特性,在国内外各大企业得到广泛应用部署。本文首先对Elasticsearch全文检索引擎相关
论文部分内容阅读
随着大数据的发展,数据包含的信息价值越来越丰富。如何对大数据进行快速的检索,成为大数据处理的迫切需求。因此,Lucene、Solr、Elasticsearch、Sphinx、Xapian等开源搜索引擎便应运而生。其中分布式全文检索引擎Elasticsearch以其近实时、全文检索、高可用、易部署、接口友好等特性,在国内外各大企业得到广泛应用部署。本文首先对Elasticsearch全文检索引擎相关的研究文献和源代码进行了深入的研究,分析了Elasticsearch的索引分片机制和负载均衡策略,提出了相应的优化策略并使用实验进行验证。主要研究工作如下:在Elasticsearch索引分片方面,论文针对索引分片数量配置问题以及索引分片放置未考虑节点性能的问题。提出了一种基于性能评估的索引分片放置策略。该策略首先结合节点性能和索引数据量构造了索引分片数量模型,以获取更合理的索引初始配置;接着,在创建索引时,使用线性加权法对各节点进行性能评估,选择性能较优的节点优先参与分片的放置,同时校验Elasticsearch原有的分片放置规则。通过与Elasticsearch默认索引分片放置策略进行实验对比,基于性能评估的索引分片放置策略能够降低Elasticsearch检索时延,充分利用节点性能,提高集群稳定性。在Elasticsearch负载均衡方面,论文针对热点数据高并发访问时,形成的热点分片集中于某些节点,造成这些节点负载过高的问题,提出了一种热点分片动态迁移策略。监控热点分片数量达到阈值节点,将其中的热点分片迁移到较空闲节点中,并使用线性加权法对节点进行负载评价,以选择目标节点。在此基础上,进一步提出了一种基于随机游走算法的主分片重新选举策略,利用副本分片机制实现主分片重新选举,以此将热点分片的大量请求进行转移,并使用随机游走算法进行全局负载调整。通过与Elasticsearch默认负载均衡策略进行实验对比,后者不仅能更有效的均衡集群负载,而且能避免迁移分片带来的系统开销和服务时延。研究工作表明,论文提出的基于性能评估的索引分片放置策略和热点分片的负载均衡策略,能够有效提高索引性能和集群稳定性,并进一步均衡Elasticsearch集群负载。对Elasticsearch应用部署,具有重要的价值和意义。
其他文献
随着光伏市场的不断发展,市场的不断扩大,各原材料厂商从性能和成本上考虑,光伏组件的封装材料不断的更新,其中光伏组件封装材料背板有着革命性的变革,下面介绍的是一些关于
太赫兹成像作为太赫兹的关键技术之一,在安检、无损检测等方面有广阔的应用。经典太赫兹时域光谱成像技术受波长的衍射极限影响,分辨率只有几百微米,难以实现亚波长成像测量
类别加工在人类认知加工中具有重要作用,也是认知心理学研究的重要内容,包括类别学习、类别表征及类别建构。类别学习是学习者通过有反馈的类别判断,形成新类别的过程;类别表
随着人口老龄化,近年来心脏病的发病率持续增高,严重威胁着全球范围内人们的健康。心房颤动(Atrial Fibrillation,AF)作为心脏病中最普遍的一种病症,通常被简称为房颤,是临床
本文是一篇翻译实践报告。报告中探讨的口译实践是笔者于2018年6月9日至11日为宁夏金海兴昇碳化硅有限公司与莫桑比克公司商业合作担任的为期三天的口译,此次任务涉及到陪同口译与交替传译。口译过程中,讲话者赘语、口头语现象频繁出现,内容繁多,结构松散,时有专业化的词语出现,给笔者翻译带来很大难度。笔者的口译笔记能力相对较弱,当遇到口语化词汇过多或信息密度过大时,所记笔记就会出现缺乏逻辑、混乱的情况。此
建国五十年来,我国的社会经济发生了翻天覆地的变化,各类专业技术人才和管理人才在我国社会主义革命和建设中发挥了积极的骨干作用。随着整个资源配置方式的改变,我国的人才
近年来,我国商业银行逐渐陷入盈利困境,既要应对融资成本的不断高升,又要应对传统收入模式的缺陷。分析国内外已有实践经验,发展资产证券化有利于推进国内银行健康发展。当前包括美国等在内,各金融市场较为发达的国家,其资产证券化均已经发展到较高的水平,同时不断渗透到金融企业各分支。资产证券化在各国金融市场中扮演着十分重要的角色,因为通过资产证券化有助于提高银行的盈利水平。一方面,商业银行通过资产证券化能将流
随着通信技术的发展出现了用数据通讯网络代替磁带记录与传输,将数据直接传至数据中心处理的实时VLBI技术,它包括准实时和真实时VLBI两个技术层次,是VLBI技术的一次飞跃.实时
目的观察围手术期综合护理对急性闭角型青光眼患者术后近期恢复和远期生存质量的影响。方法将114例行手术治疗急性闭角型青光眼患者随机分为对照组和观察组各57例,对照组患者