【摘 要】
:
互信息和朴素贝叶斯算法应用于垃圾邮件过滤时,存在特征冗余和独立性假设不成立的问题。为此,提出一种改进互信息的加权朴素贝叶斯算法。针对互信息效率较低的问题,通过引入
【基金项目】
:
国家自然科学基金(61300216)
论文部分内容阅读
互信息和朴素贝叶斯算法应用于垃圾邮件过滤时,存在特征冗余和独立性假设不成立的问题。为此,提出一种改进互信息的加权朴素贝叶斯算法。针对互信息效率较低的问题,通过引入词频因子与类间差异因子,提出一种改进的互信息特征选择算法,从而实现更高效的特征降维。针对朴素贝叶斯分类算法的独立性假设问题,在朴素贝叶斯分类时使用改进互信息值进行特征加权,消除部分朴素贝叶斯条件独立性假设对邮件分类的不利影响。实验结果表明,相比传统朴素贝叶斯算法,该算法提高了垃圾邮件过滤的精确度、召回率与稳定性。
其他文献
在经典的均值-方差模型中,研究者往往假设收益率服从正态分布,用收益率均值估计其期望。但在实际问题中收益率往往不满足假设,同时考虑到方差度量风险的局限性,从而我们构建
以云南寻甸县棚户区改造项目为例,介绍了复杂工况下施工电梯基础的特殊处理和双笼翻板门电梯受条件限制而进行的改门处理,从而有效解决了施工电梯在有隔震层情况下的基础布置
近年来,随着网络技术与计算机技术的迅猛发展,网络化控制系统(Networked Control Systems,NCSs)的研究得到了国内外控制领域专家学者的广泛关注。在NCSs中,控制器得出的控制信号或传感器采集的测量信号均可通过网络进行传输。随着网络化控制技术的快速发展,多智能体系统(Multiagent Systems,MASs)也逐渐接入网络,网络化多智能体系统(Networked Mul
本文应用边界元法计算了强震下流体的非线性晃动及其对槽身的水平力及翻转力矩,将所得数值结果与线性解析方法的计算结果作了比较,分析了两类结果的异同点.计算表明:强震时,