基于决策树的组合分类器的研究

被引量 : 0次 | 上传用户:meteorwei66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
组合分类器是近年来机器学习领域非常热门的一种建模方法。组合学习是这样一个过程,多种模型,如分类器或专家系统,以某种策略分别产生并组合起来解决一个特定的计算智能问题。组合学习主要是用来提高模型的性能,或降低选择一个很差的模型的可能性。本文以组合分类器为主要研究对象,重点对几种组合分类器算法,装袋,提升,随机森林,旋转森林进行了深入的研究。本文通过实验对bagging,AdaBoost和random forest算法进行了比较,证实了random forest的设计思想:在bagging的基础上引入变量选择的随机性,是非常有效的。Random forest不仅能显著减少算法的运行时间,而且绝大多数情况下可以提高预测的准确率,这也正是random forest适合处理高维数据的原因。在UCI数据集上进行实验,确定了rotation forest算法中两个参数的最佳取值方法,证实了rotation forest在小规模集成情况下即可获得较好的识别率。根据不平衡数据集的特点,改进random forest和AdaBoost算法。AdaBoost中引入基分类器对样本不同类别的识别权重。随机森林则在三个方面:自助样本的生成,最佳分离值的寻找,叶子结点标签的确定都加入了样本权重。在UCI数据集上进行实验,证实了改进的AdaBoost算法的有效性及存在的缺陷,确定了weighted random forest算法中正负类权重的设置范围。实验表明,处理不平衡数据类的时候,若权重设置合适,weighted random forest可以取得比random forest更好的识别效果。
其他文献
中西方文化有着各自不同的特点,它们各有所长,无所谓优劣之分。因此,对于西方文化,我们应该秉承鲁迅老先生的“拿来主义”,“去其糟粕,取其精华”。本文从中西方不同的文化背
对于工作在地球静止轨道的天基红外弹道导弹防御系统来讲,红外小目标检测技术是提高系统作用距离、增强系统防御能力的关键技术之一。该项技术在算法研究领域主要包括云杂波成
在未经第三人许可时,行政机关强行公开与第三人有关的商业秘密或个人隐私,现行的政府信息公开制度并不能切实的保护其合法权益。在涉及第三人信息保护的程序方面,通知事项标
随着经济的高速发展,我国对能源的需求量日益增加。大力发展可再生能源利用技术,已成为保障国民经济持续高速发展的重要战略举措。海上风能是海洋可再生能源的重要组成部分。目
目的观察微量元素锌辅助治疗变应性鼻炎的临床疗效,从而为变应性鼻炎的治疗和预防提供新的方案。方法收集2010年1~12月在宁夏医科大学总医院变态反应性疾病诊疗中心就诊的资料
灵芝是珍贵的大型真菌,在我国具有悠久的栽培历史。现代医药学研究证明,灵芝含有多种活性成分,如灵芝多糖、三萜类化合物、核苷等,具有抗肿瘤、保肝解毒、调节血管系统、抗神
在无线通信系统中,射频收发机扮演着举足轻重的角色,而其中的频率合成器更是起着至关重要的作用。频率合成器通常作为频率源,提供给无线通信系统,实现调制、解调与频谱搬移等重要
<正>随着陕西省高速公路建设的持续快速发展以及路网规模的不断扩大,社会公众对高速公路信息服务的需求也越来越迫切。正在建设的陕西省高速公路网综合监控系统在设计之初就
随着信息化建设的迅速发展,越来越多的应用需要访问多种异构数据源。这些数据源由于地理位置分布不同、所处平台及操作系统不同、采用的数据库模式不同、数据语义表示的不同
在硼砂限量、不添加西药及抗菌药的情况下,采用生物制剂作为天然矿物 质及中药精油的载体,将口腔抑菌剂快速送入细菌内部.提高丁香酚、硼砂等口腔抑菌剂对口腔致病菌的抑杀效