随机缺失模式下的非参数插补

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:JAVA_Star
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无论是在上世纪计算机发展比较缓慢的年代,还是在当下的大数据时代,人类面临着庞大数据的挖掘和缺失值的插补.关于缺失值插补这个问题,从上世纪五十年代左右就有学者关于这个问题进行了研究.一般来说,关于不完整数据的处理方法有特殊值代替法,参数估计法,贝叶斯估计法等等.本文主要研究数据插补方法,其中均值插补方法作为一种操作简单易被掌握的插补方法,被广泛运用,但其忽略了数据之间的关联强度与距离间的关系,因而有自身的缺陷.另外一种方法就是最近邻估计方法,它利用缺失值附近观测值与其的关联强度的关系,进而插补缺失值.传统的插补方法还有逆概率加权法,核密度插补法等等.已有学者提出了结合逆概率加权插补法和核回归函数插补法构造出新的估计量.本文考虑到逆概率加权插补方法的稳健性优于核回归插补法,结合逆概率加权插补法和最近邻插补法优点的基础上,构造了两种凸混合插补估计量,并且在满足正则条件下证明了两者的渐近正态性质.模拟的结果显示无论回归函数是否连续,两种混合插补估计量的模拟效果比传统插补法效果更好.在鸢尾花数据分析中,三种插补估插补法的比较总体上的效果比较好,在葡萄酒数据分析中凸混合估计量的平均绝对偏差明显要优于其他两种插补法.
其他文献
随着大数据时代的来临,信息知识化已成为信息管理的一个发展趋势,知识库作为一种常见的知识存储与管理工具,极大提升了计算机的智能处理能力。当前以互联网中丰富的资源作为
化工机械设备安装工艺技术是保证设备正常运行的关键环节,随着我国对化工机械设备的安全性能越来越重视,对其安装工艺的要求也越发的严格。所以,文章将对化工机械设备的安装
目的:从分子水平上探讨红霉素(EM)的抗炎作用机制,为临床防治慢性阻塞性肺疾病(COPD)提供新的思路。 方法:体外培养人支气管上皮细胞(16HBE),将细胞随机分为8组,先加入红霉素干
种业与金融结合是深化种业改革、促进现代种业发展的必由之路。本文系统阐述了种业与金融结合的内涵与机理,分析了种业与金融结合的传统路径及存在的规模不足、信息价值低、风
2012—2016年,参加中国人民银行组织的商业银行压力测试的银行数量逐步增加。风险种类从信用风险扩大到市场风险和流动性风险。压力情景设计不断进行修改和调整。尽管历年具
【正】 1998年~2001年,我院采用胰岛素外用治疗糖尿病足34例,效果满意,现报告如下。 临床资料:本组62例患者,随机双百法分为两组,治疗组34例,男22例,女12例;年龄49~80岁,平均65
目的:探查苏州地区气温、气压变化对特发性气胸(ISP)发生的影响 方法:自1998年1月1日到2000年12月31日三年中选取129例连续发生的ISP患者,患者未发生气胸前在苏州本地区逗留
<正>如何改变学习方式,促进课堂教学中学生的有效参与,从而创设高效课堂,全面发展学生素养?本文对此试探讨一二。一、摒弃"串讲串问",创设"想参与"课堂早在10年前,著名特级教
文章以现实社会中出现的医患关系问题为背景,探讨了医患互动中存在的问题及构建互信医患关系的可能路径。在对国内外生命伦理学期刊文献和主要著作整理分析的基础上,反思了两种传统医患关系模式中存在的问题。指出,传统模式均未强调医患之间的双向互动性。而在其背后的个人主义式的临床伦理思维更不利于互信医患关系的构建。转变传统医患关系模式和二分式的临床伦理思维是当前医疗实践与生命伦理学创新发展的必然要求。以已有研究
肺移植作为器官移植的一个重要组成部分,被看作是治疗终末期肺部疾病的有效方法之一。长期以来,急性和慢性排斥反应一直成为困扰肺移植的一道难题,抗免疫排斥药物的选择及应用至