【摘 要】
:
电子邮件已经成为人们日常生活中通信、交流的重要手段之一。然而,大量出现的垃圾邮件,给用户造成时间和资源的浪费,同时极大地消耗了网络传输资源以及邮件服务器的存储空间,
论文部分内容阅读
电子邮件已经成为人们日常生活中通信、交流的重要手段之一。然而,大量出现的垃圾邮件,给用户造成时间和资源的浪费,同时极大地消耗了网络传输资源以及邮件服务器的存储空间,并对网络安全构成威胁,针对这一问题尽快寻找解决方案的需求也更加迫切。目前,应对垃圾邮件的主要方法和手段通过反垃圾邮件立法和使用邮件过滤技术进行处理,现已相继出现了多种邮件过滤技术。目前,常用的包括黑名单与白名单技术、基于关键词搜索以及设定过滤规则等方法。在实际使用中已逐渐不能满足过滤需求,基于内容分析的文本分类技术正逐步进入邮件过滤技术当中,并成为当前研究热点,其中,基于内容分析的邮件过滤方法中的典型方法是基于贝叶斯模型。本文结合文本分类技术以及贝叶斯(Bayes)理论,构造基于贝叶斯分类的垃圾邮件过滤模型,研究实现邮件过滤器的关键技术与方法,并给出核心过滤算法在邮件分类中的具体实现方法和过程,最后完成垃圾邮件自动过滤的全过程。为减少邮件的误判对用户造成的损害及垃圾邮件漏判造成的影响,提出了相应的改进措施:使用最小风险贝叶斯决策减少误判;通过垃圾邮件反馈,对分类系统进行自适应调整,以改善垃圾邮件的漏判问题。最后给出基于贝叶斯及其改进算法的邮件过滤模型及基于该框架的垃圾邮件过滤原型系统的实现。
其他文献
移动视频流系统的一个重要特点是在进行高复杂度解码计算的同时,还要进行大数据量的收发,能耗相对较高。这与移动设备相对有限的电池能量极不匹配。传统节能方法通常对网卡和CP
随着计算技术的发展,从偏微分方程、线性规划、网络分析、结构和非结构问题的有限元分析等领域中提出了求解大型稀疏线性方程组的问题。 本文就是针对大型线性代数方程组的
随着计算机网络技术的不断发展和网络应用的迅速增加,计算机网络的规模也越来越大,结构也越来越复杂。连入网络的各种设备如主机、集线器、路由器、交换机种类繁多,网络上的信息
网络存储系统近来有大量的研究,其中大部分是集中在网络存储架构和性能方面。随着云存储成为信息领域的一个研究热点,已经有越来越多的研究开始考虑基于云存储的网络存储系统架
今天是一个信息爆炸的时代,各种信息指数级地快速增长,可用的数据资源种类也越来越多,这些数据分散在各个站点、文件系统、数据库系统和一些应用系统等中。由于各行业、部门
随着Internet的高速发展,产生了海量的Web信息,其中动态网页占了很大的部分。然而动态内容比静态内容需要更大的资源需求,并且给Web服务器带来了一个很大的问题,就是伸缩性。
XML正迅速成为Web上数据表示和数据交换的标准。作为自描述的标记语言,XML能够根据具体应用灵活地表现异构数据源中的各种信息,包括应用程序之间的数据交换、结构化和半结构化
近年来随着信息化程度的不断提高,人们对计算存储资源的需求呈现出高速增长的趋势。而本地文件系统由于其性能、容量、可扩展性等诸多方面的限制,已经无法满足人们日益增长的存
在移动互联网时代,用户越来越迫切需要随时随地的无缝接入无线网络。异构无线网络的融合为此提供了可能。为了尽可能为用户提供总是最优的服务,无线接入网络必须能够实现动态选
二十世纪六十年代以来,人们开始借助计算机来求解各类复杂优化问题。一类智能型的遗传算法(Genetic Algorithms,GA)在复杂优化问题的求解方面表现出了优越的性能,越来越多的受