【摘 要】
:
特征选择是机器学习中的关键环节,可有效提高模型训练效率与预测精度,增强模型的可解释性。经典的特征选择方法最小冗余最大相关(Minimal Redundancy Maximal Relevance,mRMR)既考虑了特征与目标变量之间的关联,同时也考虑了特征与特征之间的冗余,具较强鲁棒性,应用广泛。但其存在相关性测度与冗余性测度不可比、排序后特征逐个引入不能自动终止、直接去冗余特征可能导致预测精度下
论文部分内容阅读
特征选择是机器学习中的关键环节,可有效提高模型训练效率与预测精度,增强模型的可解释性。经典的特征选择方法最小冗余最大相关(Minimal Redundancy Maximal Relevance,mRMR)既考虑了特征与目标变量之间的关联,同时也考虑了特征与特征之间的冗余,具较强鲁棒性,应用广泛。但其存在相关性测度与冗余性测度不可比、排序后特征逐个引入不能自动终止、直接去冗余特征可能导致预测精度下降等弊端。本文引入可普适性捕获线性关联与非线性关联的最大信息系数(Maximum Information Coefficient,MIC)测度,并以之替换mRMR算法中的相关测度与冗余测度,解决了mRMR相关性测度与冗余性测度不可比的缺陷。进而结合冗余分摊策略(而非去冗余策略)发展了一种新的特征选择方法MIC-share。新算法无需借助预测模型,可依MIC-share得分最高原则自动终止特征选择,有效提高特征选择效率。以2个回归数据(Friedman和Housing)和2个分类数据(Breast和Sonar)为例,以支持向量机预测模型进行仿真实验,验证了其有效性。MIC估计算法Approx Max MI基于经验性给定的最大网格约束标准(B(n)),存在统计势偏低,估计值欠准确等缺陷。本文基于卡方独立性测验,进一步提出了一种新的MIC估计算法OIC(Optimal Information Coefficient)。OIC对网格划分(离散化)过程中均分方向与寻优方向的分段数均进行约束,自动终止无显著作用的网格划分。经模拟数据验证,由OIC算法估计的MIC值更符合其理论取值范围[0,1],并且具有更高的统计势与计算效率。三个真实应用案例同样验证了其有效性。
其他文献
参苓白术散是益气健脾、除湿止泻之经典名方,主治脾虚湿盛证,具有调节免疫系统、改善肺功能、改善胃肠功能、抗氧化、抗肿瘤、抗炎等药理作用,现代临床多用于治疗慢性阻塞性肺疾病、肺纤维化、支气管哮喘、肠易激综合征、溃疡性结肠炎、慢性腹泻、糖尿病等。笔者总结了近年来参苓白术散的化学成分、药理作用和临床应用,并基于中药质量标志物(Q-marker)“五原则”对参苓白术散的质量标志物进行预测分析,提示人参皂苷R
2003年的非典型肺炎(SARS)的强传染性导致了许多人抛弃了传统的购物模式,闭门不出,远离了以往熙熙攘攘的超市、商场,以淘宝等为代表的电子商务强势崛起,随着在线支付手段的诞生,电子商务逐渐渗透进人们生活的方方面面,电子商务也从刚开始的B2B,逐渐诞生出C2B、C2C、O2O、B2B2C等商务模式。随着“互联网+农业”的不断深入,越来越多的农产品通过电子商务走向网络、走向大众,极大地缩短了消费者与
目的:运用队列研究方法,研究中药汤剂联合糊剂治疗肝胃郁热证反流性食管炎的临床疗效及安全性,为临床应用提供循证医学证据。方法:1.纳入2019年01月-2020年12月就诊于苏州市中医医院脾胃科门诊及病房中符合肝胃郁热证反流性食管炎诊断标准的患者共计51例,其中治疗组、对照组分别为30例、21例。2.治疗组予口服中药汤剂+糊剂+雷贝拉唑,中药方即在左金丸合橘皮竹茹汤基础上随证加减,早晚饭后1小时各一
宁乡猪作为我国优质的地方品种,其脂肪含量丰富,肌内脂肪分布均匀,同时肌内脂肪酸中不饱和脂肪酸的含量更是高达59.6%,显著高于外来品种杜洛克,大白猪及长白猪。已有研究证明miRNA在脂肪组织生长发育过程中起着调控作用,但miRNA在宁乡猪中的研究相对较少。而环状RNA作为miRNA的上游靶基因,对于miRNA具有海绵吸附作用,因此当miRNA对宁乡猪脂肪组织进行调控的同时环状RNA也会发挥其海绵吸
目的:通过观察比较葛氏伤科手法联合塑形纸夹板和切开复位克氏针内固定治疗儿童伸直型肱骨髁上骨折的影像学及临床疗效,探讨葛氏伤科手法联合塑形纸夹板固定的临床治疗效果,为儿童伸直型肱骨髁上骨折提供一种新的保守治疗思路。方法:本研究根据标准纳入2018年10月至2020年10月在苏州市中医医院骨伤科门急诊及苏州大学附属儿童医院小儿骨科治疗的伸直型肱骨髁上骨折患儿作为研究对象,参照患儿及家属意愿,选择保守或
目的:应用中医传承辅助平台整理吴门医派名中医赵笑东主任临床降压膏方处方,总结分析其膏方治疗高血压的治则治法、遣方规律和用药特点等,更好地传承吴门中医的膏方特色,指导临床。从细胞、分子、蛋白质水平观察降压膏方对AngⅡ诱导的心肌细胞肥大和自噬的影响,研究和探讨降压膏方调控自噬抑制高血压性心肌肥厚的作用和机制。方法:1.收集整理赵笑东主任2018年01月01日至2020年12月31日膏方门诊的高血压患
目的:在分析腰椎间盘突出症患者的证型特点、疼痛情况和心理问题的基础上,探究腰椎间盘突出症的中医分型及其相关的疼痛症候与焦虑、抑郁的关系,旨在发现腰椎间盘突出症的不同中医分型和疼痛与心理问题的相关性,从而对其采取不同的临床干预治疗措施。方法:收集从2018年09月到2021年01月在苏州中医医院就诊的腰椎间盘突出症患者54例,根据患者的临床症状表现,填写不同问卷调查量表,包括分型、舌苔、焦虑自评量表
植物具有多种生理生化机制抵抗生长环境中的病原微生物,而病原微生物为了成功侵染植物进化出效应因子抑制植物的抗病性,植物进而进化出抗病(R)基因监控并识别这些效应因子激发强烈的抗病反应。因此克隆作物R基因并了解其抗病机制是当今作物抗病育种的研究重点。本课题组前期构建了大豆根腐病抗病品种与感病品种的杂交群体,并通过图位克隆、精细定位和测序得到的C2H2锌指蛋白转录因子RpsYu基因,它是大豆中的一种新型