基于中文微博的话题趋势预测系统的设计与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:ty_142857
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来社交网络得到了快速的发展,其独有的特性使得用户发布消息更加容易,信息传播更加快捷,然而社交网络的发展也对于商业机构的管理者和政府机构的决策者,提出了一定的挑战。这些机构的管理者和决策者需要随时并且快速的应对社交网络上面的热点话题及相关事件,因为这些事件有时会对相关机构产生非常现实且巨大的风险。本论文将以新浪微博为实际的例子探索如何在社交网络中对于话题趋势做出预测。在本文中,首先给出了社交网络中热点话题趋势预测的形式化定义和一个话题趋势预测模型,然后提出了一种针对时间序列数据进行特征抽取和构造的新方法,基于提出的新方法构造了三个相互补充的特征子集,最后将这三个特征子集线性组合起来做为支持向量机SVM的输入向量进行话题趋势的预测。为了验证预测模型的性能,本论文采集了一个高质量的新浪微博数据集。基于获取到的数据,对预测模型进行了完整的测试,取得了良好的效果。论文首先介绍了近些年来社交网络的发展及社交网络的相关研究领域;在第二章中论文提出了基于SVM的话题趋势预测模型,并且详细的给出了特征向量的构造方式;在第三章论文给出了爬虫框架的详细设计与实现,然后描述了话题趋势预测系统内部各个子系统的详细设计与实现;论文在第四章对于整个系统进行了详细的功能测试和性能测试,测试表明整个系统达到了预期的设计目标;在最后一章,论文对未来的工作进行了展望,并总结了作者在研究生期间的所有工作和成果。
其他文献
网络拓扑发现一直是近年来的研究热点,基于这个基础,可以进行推断或计算网络性能指标、评价网络行为等进一步的工作。尤其是在网络安全领域,拓扑发现已经成为网络安全评估系