基于SVM算法的垃圾邮件过滤研究与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户：yanxt99

【摘要】

：

本文针对国内中文垃圾邮件过滤研究缺乏语料库的问题，首先收集了700多封邮件建立了语料库。再在这个语料库的基础上进行研究，将邮件文本特征向量化，利用支持向量机文本分类

【作者】

：

赵靖

【机构】

：

北京交通大学

【出处】

：

北京交通大学

【发表日期】

：

2005年期

【关键词】

：

垃圾邮件文本分类中文分词支持向量机特征提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文针对国内中文垃圾邮件过滤研究缺乏语料库的问题，首先收集了700多封邮件建立了语料库。再在这个语料库的基础上进行研究，将邮件文本特征向量化，利用支持向量机文本分类算法进行二值分类，并根据邮件过滤中代价不对称问题对支持向量机算法进行了Cost-sensitive改进。论文利用支持向量机算法和代价敏感的支持向量机算法对样本进行训练和分类测试。实同时，结合中文分词，特征提取等垃圾邮件过滤问题中的关键技术，本文设计开发了一个垃圾邮件过滤预处理系统，该系统实现了将邮件文本表示成数字化的特征向量的功能，为本文研究提供了可靠的实验平台，并为开发实用的垃圾邮件过滤系统奠定了基础。

其他文献

Internet流量工程关键技术研究

本文研究的核心是集成QoS和流量工程为目标的网络流量分配，同时探索Internet流量工程相关的关键技术。主要研究工作包括：基于跳数和时延的并行LSP流量分配；支持QoS的负载均衡；区

学位

流量工程服务质量网络测量网络优化网络流量互连网流量分配

高动态低载噪比信号的频率估计算法研究

为了从高动态环境中估计出载噪比极低的目标信号的频率,国内外开展了大量的算法研究,但这些算法的关注点大都集中在对恒频信号频率的估计,应用环境的载噪比一般也在30dBHz以

学位

高动态低载噪比频率估计捕获拟合

基于网络处理器的NAT的设计与实现及IPv6三层转发的调测

本文介绍了作者在研究生学习期间就英特尔(Intel)网络处理器IXP2400所做的研发工作——基于IXP2400的防火墙中网络地址转换(NAT)子系统的设计和实现，以及基于IXP2400的第六版

学位

网络处理器网络地址转换互联网协议

无线扩频通信系统中Rake接收技术的研究

CDMA是第三代移动通信系统的主流技术,而无线通信的目标是实现无所不在的、高质量的、高速率的移动多媒体传输,扩频调制技术是移动通信技术中最有竞争力的技术之一。如何有效

学位

CDMARake接收机信道估计DS-SSFPGA

超宽带无线通信系统的微网时频码设计及异步多微网性能

随着无线通信研究技术的发展,各种无线通信系统相继出现,作为一种能够在短距离范围内提供更高数据传输速率而且成本更低、功耗更小的无线通信技术,超宽带(U1tra WideBand—UW

学位

多子带-时频交织-正交频分复用超宽带异步操作微网时频码无线个域网

自适应子空间估计及其在目标方位跟踪中的应用

多目标方位估计及跟踪技术在声纳、雷达、通信和国防建设等众多应用领域中占有十分重要的地位。论文从实际应用的角度出发,全面论述了子空间类多目标方位估计和跟踪算法的理

学位

阵列处理特征值分解高分辨方位跟踪自适应子空间估计

低轨卫星通信系统用户位置管理策略研究

在卫星通信领域,针对低轨卫星移动通信系统的研究是近年的热点.位置管理技术作为低轨卫星移动通信系统的一项关键技术,关系着整个网络的性能.随着移动用户数量日渐增长,位置

学位

低轨卫星网络位置管理动态位置更新方案

低轨卫星移动通信系统切换技术和空间通信协议研究

卫星移动通信系统是实现全球个人通信的必然组成部分,其中低轨卫星移动通信是当前卫星通信界的研究热点之一。本文讨论了低轨卫星移动通信系统切换技术中的各种切换策略,把切

学位

低轨卫星移动通信切换信道预留SCPSTCP

基于MIMO-OFDM系统的UEP传输方案研究

在宽带无线通信领域,MIMO-OFDM系统日渐成为保证数据高速、可靠传输的重要手段,而视频数据对信道传输质量的敏感度较一般数据更高,利用UEP分级传输技术可以改善无线信道中的

学位

MIMOOFDM不等差错保护空时分组码

基于SVM算法的垃圾邮件过滤研究与实现

其他学术论文