基于不确定理论的云数据处理关键技术研究

来源 :北京科技大学 | 被引量 : 4次 | 上传用户:vicovicovicovico
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2016年1月,RightScale对全球1000多个企业用户进行了关于公有云、私有云和混合云的使用情况调查,该调查报告结果显示95%的受访者正在使用云。现实世界中,不确定因素普遍存在于各种现象中。在云计算环境下,云数据中心中云数据、虚拟机的迁移、调度等问题都具有不确定性。对于不确定性数据处理,目前已有很多成果,多集中在实体数据的不确定性,对现实中一些实际问题覆盖还不够。对于实体间关系的非确定性处理,已有文献运用随机和模糊理论解决近邻查询处理问题。而实体间关系有时还表现为主观不确定性,这种主观不确定性既不是随机的也不是模糊的。现实中,很多问题无法获得历史数据,从而无法用概率论求解事件发生的频率,此时必须依据专家经验对事件可能发生的信度进行评估,此方法使得信度的方差远远大于频率。为了处理云数据的主观不确定性,将采用不确定理论对云数据的处理技术展开研究。本文致力于云数据查询处理、查询优化关键技术的研究,由于异构性、隐私性、隐私保护、数据不完整、数据不精确等原因,云数据中心的数据存在不确定性,借鉴和吸收不确定理论的相关研究,将云数据中心抽象为不确定图。根据不确定图的路径查询算法,对云数据的查询处理、查询优化进行深入的探讨,本文的主要工作和贡献可以归纳为:(1)提出了云数据安全防护框架。该框架主要包括物理安全、虚拟网络安全、云操作系统安全、虚拟集群安全、数据安全、SaaS/PaaS/IaaS安全、安全管理与安全运维等层次模块。该框架在安全目标、系统资源类型、基础安全技术方面与传统安全是相同的,而又有其特有的安全问题,主要包括:虚拟化安全问题和与云计算分租服务模式相关的一些安全问题。该框架在虚拟化安全、数据安全和隐私保护等方面具有更好的安全性和保护能力。(2)提出了基于云数据安全防护框架的不确定随机故障树风险分析方法。该方法基于不确定理论和机会理论,对故障树进行构建和分析。故障树由基于底事件之间的逻辑关系构成。若底事件的故障率由历史数据获得,则被表征为随机变量:若没有历史数据,但可从专家主观判断得到,则被表征为不确定变量。除此之外事件发生的机会是不确定的随机变量,因此构建了混合仿真算法来计算顶事件发生的机会。通过不确定随机故障树分析法对所提出的云数据安全防护框架进行风险分析。(3)提出了不确定网络条件可信近邻查询方法。该方法包括可信距离的计算(CMCD)算法,可达路径长度计算(CMFP)算法,可达路径期望长度计算(CMDLFP)算法,条件可信k近邻查询(QMCCK)算法。将不确定网络建模为不确定赋权图,定义不确定图的样本图,样本图指数,基础网络,可达路径长度及可达路径期望长度,并给出基于不确定理论的高效不确定条件可信近邻查询算法。将不确定网络上的近邻查询等价地转化为基础网络上的近临查询问题。该可信近邻查询算法能够从非确定角度解决不确定网络环境下的近邻查询问题。(4)提出了基于不确定理论的不确定性数据Top-k查询算法。将不确定性数据集中的元组建模为不确定网络,将有序元组的Top-k查询等价转化为相应样本图中边的不确定测度关系,并对样本图依据所包含边的排序位置进行分类,该算法避免计算所有元组在样本图中的排名不确定测度值,提高了不确定性数据的Top-k查询计算效率。将不确定性数据中,基于参数化排名函数的Top-k查询等价转换为依Top-k值不同的有限查询,并结合Spark Map-Reduce编程框架完成了系统实现。
其他文献
随着国内3G和4G的发展,智能手机在中青年人群中越来越普及,基于位置的服务也开始出现并流行。人们在享受基于位置的服务带来的方便和快捷的同时,却将自己的精确位置信息泄露
近年来,随着识别技术在自然资源分析、天气预报、导航、地图与地形配准、环境监测等领域的广泛应用,各种理论和方法也被大量应用于其中,非负矩阵分解方法作为一种代表性的矩
随着信息技术的飞速发展,媒体数据的形式已经从单一文本数据逐渐转变为表达形式更生动,内容更丰富的图片,视频,音频等多模态数据,而各种数字化信息采集设备及互联网的普及,使
公司实际控制人是公司异质化治理的产物,但现行法律规定对于实际控制人的定义与认定标准都不甚明确,立法中对于其法律责任存在一定空白。实务中实际控制人易规避法律风险为私
3月6日,地委副书记、行署专员艾则孜·木沙在洛浦县参加干部维稳誓师暨发声亮剑宣誓活动动员大会,并作了反恐维稳主题宣讲。他要求,维吾尔族党员干部尤其是领导干部要敢于发声亮
报纸
一、问题的提出从去年开始的金融海啸已经波及到了各行各业,大量企业的正常运营已经受到了严重的影响。如何增强自己的竞争力,在大风大浪中站稳脚跟,是每个企业需要思考的问
文章从宁波公园绿地、道路绿地、防护绿地以及居住区绿地等四个方面阐述了宁波城市园林发展的现状,指出存在植物认知方面的误区以及绿化模式单一、生物多样性水平低、忽略外围
目的 超长鼠齿钳联合推结器在腹腔镜辅助小切口食道-空肠吻合术中的应用,探讨其可行性、安全性及临床效果。方法 回顾性分析2009年7月至2014年3月308例Ⅱ、Ⅲ型食管胃结合部
物联网被认为是信息通信技术领域继计算机、因特网和移动通信之后的第四次浪潮,具有广阔的应用前景和巨大的市场潜力。然而,物联网的实现在感知终端和数据管理方面仍然面临诸