OFFSS算法中相似性度量公式的研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:naomi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征子集选取在机器学习,数据挖掘和模式识别领域起着很重要的作用。OFFSS (Optimal Fuzzy-valued Feature Subset Selection)是一种新的模糊值特征选取的方法,是基于两类事例集合的重叠程度来选取特征空间中最优特征子集。和其他特征子集选取方法如OFEI,FQI,MIFS 相比,OFFSS 虽然在训练,测试精度上没有明显的优势,但是却有相对较低的计算复杂度。由于OFFSS 中的重叠度是建立在某一个确定的相似性度量公式之上,所以不同的相似性度量公式会导致不同特征子集的产生。在三角隶属函数的基础上,对于相同的数据,本文讨论了不同相似性度量公式在OFFSS 的重叠度,所抽取的特征子集,抽取后的特征子集用于分类的准确性之间的关系。在此基础上,找到一个比较适合OFFSS 算法的相似性度量公式。
其他文献
本文对网络测量、网络带宽测量的历史进行了回顾。按照测量方法的组成部分对带宽测量方法进行分类,突出了测量方法的特点,指出了各种测量方法的适用条件、技术原理和局
全球信息化快速推动了中国软件产业的不断发展,极大地促进了软件测试业的进步,但在软件测试的认识、软件测试技术、软件测试商业化等方面,目前中国的软件测试业与欧美还存在很大
本文主要研究滑动窗口连续查询的处理问题。滑动窗口查询是数据流中一类重要的查询类型。根据执行方式的不同,滑动窗口查询可以分为元组驱动滑动窗口连续查询和时间片
本文针对现在的异常检测系统由于计算机软硬件的原因,而无法很好的处理大流量的环境中的海量数据的问题,提出了一种基于数据流的在线保存数据概要信息的方法,实现了一个
本文研究了数据挖掘中频繁模式,聚类,分类算法,并提出了能够适应生物信息学数据和大数据量的频繁模式,聚类,分类挖掘算法。同时,提出了一种保存挖掘结果的缓存机制,提高了挖掘系
传统的分布计算与分布式数据库的研究是基于有线网络和固定主机的,这些都采用了一些默认的隐合假设,例如固定网络连接、对等通讯代价、主机节点固定不变等。计算技术和无线通讯
本文从探讨企业应用程序框架出发,对企业应用程序框架的概念的组成进行研究.对基于J2EE平台技术的CERP的企业应用程序框架进行了深入分析.总结了CERP应用程序框架的构成要素,
本文实现了基于虹膜的计算机自动诊断系统中的虹膜定位、虹膜图谱覆盖、分区技术和根据病理柔性分区关键技术.首先,本文提出了一种针对东方人种虹膜的虹膜定位算法.该算法利
在当今社会里,信息的爆炸式增长已经成为人们必须面对的问题。借助计算机在海量信息中找到人们所需的有用信息的研究越来越受到人们的关注。本文回顾了信息检索技术的发展
利用目前商业PC硬件提供的现有性能与条件,选取与其相匹配的有较大优化可能性的且具有较广泛适用性的现存物理性动态模拟算法方案,对其进行有针对性的调整以适应其硬件结构,