适于短文本的舆情热点挖掘及其情感倾向分析系统

来源 :浙江大学 | 被引量 : 0次 | 上传用户:como
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的普及和日趋丰富的社交软件的出现,网络作为一个新起的舆论方式已深入人们的日常生活。舆情分析任务涉及分词、聚类、情感分析等相关工作。在这些工作中算法存在效率和精度难以平衡的问题。本文在分词、聚类、情感分析方面分别针对这个问题提出了算法模型,并做了实验加以验证和阐述。最后将这些技术应用于中关村网站进行了舆情分析工作。本文的主要研究成果包括以下四方面:  1.提出了基于词群的分词算法。同时利用词典、规则和建立歧义解析图模型来实现句子的切分。算法采用较HMM分词短的决策距离,降低了时间复杂度,同时又具有较高分词精度。  2.结合密度聚类、网格聚类算法的特点,提出了一种基于边缘度密度距的聚类算法。算法采用新的密度度量及与之相关的聚类定义。分析表明,该算法兼具精度和速度的优势。  3.本文结合神经网络感知器与贝叶斯分类器建立情感判定决策树。利用此模型对文章信息进行情感评判和打分,为后期的舆情分析系统提供所需功能。  4.详细讲述了前面技术在实例上的具体使用细节。后面的实验部分进行了舆情的热点挖掘、情感倾向分析、评分、评分发展趋势分析等实验。
其他文献
随着网络技术的日新月异,Web上的信息量也在飞速增长。Web已经成为一个巨大的数据源,拥有着海量的数据。这些数据中蕴含着大量有价值的实体事件,对人们的工作和社会的生产具
随着运动捕获技术的广泛使用,越来越多的人体运动数据被记录下来,并被应用到计算机动画、计算机游戏和辅助教学等领域。如何对大量的运动捕获数据进行有效的组织管理并且从中检
狼群算法是一种近几年兴起的群体智能算法,是通过模拟狼群捕猎过程中产生的一系列行为和特征,而产生的一种优化算法。狼群算法是一种以迭代方式进行的群体随机优化方法。由于
当前我国农业信息化建设已卓有成效。随着环境感知、物联网等技术的深入应用,已经可以采集到大量的农业资源信息,这给信息的可视分析带来了机会和挑战。农业物联网环境下产生的
组播是一种“一对多”的通信模式,能够优化网络资源,例如节约带宽资源、减轻网络负载等。而对于无线网状网络来说,最重要的问题也是节约网络资源,提高网络吞吐量。所以,无线
互联网已经成为反映民情民意的动态窗口,越来越多的人通过网络获取信息并在网络空间中表达自己意见和情绪,这些意见、情绪和行为倾向的集合称之为网络舆情。客观准确的判断网络
21世纪的汽车朝着人性化、智能化的方向发展。近年来,云计算、大数据等技术有着和传统行业相结合的趋势。怎样将这些技术合理、合适的应用到传统的生产、制造、金融、交通等传
端到端延时是手机视频通讯应用性能指标中相当重要的一个参数,延时测量的准确性直接关系到通讯产品的质量以及安全。然而现有的一些内部和外部延时测量方法都存在时钟同步、通
敦煌莫高窟游客流量众多,为了进一步加强对莫高窟遗产的保护,对游客流量实时监控具有重要意义。游客流量的监测需求使得对低功耗传感器定位技术的研究成为必需。通过对基于AS39