基于安全样本筛选的不平衡数据抽样方法

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:x1114891413
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对欠抽样可能导致有用信息的丢失,以及合成小类的过抽样技术(SMOTE)可能使大类和小类间类重叠更严重的问题,文中提出基于安全样本筛选的欠抽样和 SMOTE 结合的抽样方法(Screening_SMOTE).利用安全筛选规则,识别并丢弃大类中部分对确定决策边界无价值的实例和噪音实例,采用 SMOTE 对筛选后数据集进行过抽样.基于安全样本筛选的欠抽样既避免原始数据中有价值信息的丢失,又丢弃大类中的噪音实例,缓减过抽样数据集类重叠的问题.实验表明在处理不平衡数据集,特别是维数较高的不平衡数据集时 Scree
其他文献
史料学研究的根本原则是以史料为依据,实事求是。史料学视域下历史虚无主义批判的基本方法主要包括:遵循唯物史观,客观地分析史料,反对历史虚无主义主观性使用史料的唯心史观
1.本刊是综合性风景园林学术刊物,现为"国家中文核心期刊""中国科技核心期刊"。主要刊登风景园林学科及交叉学科的基础研究与应用研究方面原创的学术论文、研究报告、规划设计优
中国传统园林是中国传统文化的重要组成部分,其中有着大量体现优秀传统营造理念及经验的光景案例。缘起于吴硕贤院士提出的"光景"概念以及开展"光景学"学科研究的倡议,对在园
期刊
基于景观空间视觉吸引原理,对唐山市迁西县县域尺度下现存绿道的优势和建设的必要性进行深入分析,提出了基于视觉吸引分析的绿道规划技术框架,明确了建设的4个步骤,构建出迁
近年来,随着中国经济进入新常态,城市建设的重点从增量扩张转向存量更新,城市公共空间设计的主要任务也不再单是针对城市新增用地,还需关注既有空间的品质提升、环境改善和特
对于德国的认识,最早就是两个伟人,卡尔·马克思、弗里德里希·恩格斯.至今牢记心里的是那句写在《共产党宣言》开篇的第一句话“一个幽灵,共产主义的幽灵正欧洲的上
期刊
风景名胜区源于古代名山大川,是中国国土资源的精华,是集体记忆的重要载体。风景名胜区的重要使命之一是构建和唤起集体记忆,形成文化自觉,增强文化自信,而这有赖于风景名胜
随着全球经济的发展,国际社会对气候变化越来越重视,减缓温室气体排放已经成为各国的一项重要任务。加入WTO以后,中国经济迅猛发展,能源消费和污染排放也迅速增加,尤其是碳排
天台宗作为佛教中国化的第一个宗派,对中日佛教的发展起着关键作用。中国天台山的国清寺和日本比叡山的延历寺正是在其思想影响下建成的,由于起始于同一思想宗派,因此在漫长