微博客中面向网络热点的信息挖掘应用研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:camino
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博客作为一种新型的网络媒体,以其简洁方便的交互方式,受到越来越多网络用户喜爱。用户能够通过微博客平台实时地了解当前的社会热点,关注自己喜欢的主题,并针对这些内容发表和分享自己的观点言论。如何利用微博客的实时性和交互性等特点,从中发现与社会热点事件和网络热点主题相关的内容,从而帮助普通用户、商家、决策部门等从不同角度获取所需要的信息,己成为当前微博客背景下的研究热点。   微博客中的帖子内容简短,信息发布渠道方便多样,使得用户能够随时随地将自己感兴趣的内容分享到微博客平台之中,通过对微博客信息进行自动归类,并发现各类信息之问的隐含关联,能够方便用户对最新的微博客信息进行整体浏览;微博客中的信息能够实时地反应用户当前最关注的内容,而用户在一段时间内的兴趣往往会集中在当前的一些社会热点事件或者热点主题,通过挖掘微博客信息中关注度较高的网络热点,有利于准确了解用户的整体兴趣分布,并能够进一步把握网民兴趣的变化趋势;用户对网络热点的关注体现为时问变化和空问分布两方面,通过发现用户对不同网络热点的关注度随时空变化的相似性,能够挖掘刚络热点之间的关联,使得用户能够了解到与感兴趣热点相关的更多内容;用户在针对感兴趣的热点事件发表帖子时,往往会针对该事件的不同方面发表自己的观点言论,通过对事件的不同角度进行用户情感分析以及情感趋势监测,能够帮助了解民众对特定热点事件的情感变化,从而辅助评估和掌握事件的发展状况。本文以微博客为研究背景,运用网络信息挖掘技术从信息归类浏览、网络热点发现、网络热点关联检测以及针对热点事件的网民情感分析几方面对微博客内容进行分析和研究,主要工作包括如下几个方面:   1、提出了一种基于概率主题模型的微博客内容浏览方法,用于对微博客中包含的信息进行自动归类,并发现各类信息之间的隐含关联关系,方便用户对微博客信息进行整体浏览。该方法基于相关主题模型,通过‘用户-主题-词语’三维关联矩阵的建立,帮助用户快速了解最近一段时间内的主题类别,并查找与其感兴趣内容相关的其他用户作为备选好友,同时计算各类主题之间的关联关系,帮助用户了解更多感兴趣的内容。   2、提出了一种基于用户兴趣的微博客网络热点检测模型,用于抽取一段时间内的网络热点,并通过跟踪特定事件或主题的用户关注程度随时间的变化规律,发现其关注度较高的时段,以此分析微搏用户的群体兴趣变化。该模型通过分析用户发表的帖子信息,建立“用户-主题”的对应兴趣关系,并利用用户之间的好友关联,进一步建立主题之间的兴趣关联网络,最后利用基于链接的排序算法,实现基于用户兴趣的主题热度排序,发现特定时间段内的热点主题。   3、提出了一种基于主题之间时空序列相似性计算的微博客主题关联检测模型,用于发现微博客中所包含的热点主题之间的关联关系,帮助用户了解与自己感兴趣主题相关的更丰富的内容。该模型首先将微博客中的主题表示成相应的时空序列模式,之后计算主题之间的时空序列相似度,从而发现主题之间的关联关系。通常情况下,一个主题在不同时间会与不同的主题产生关联,而这种主题之间的动态关联关系往往是源于某些特定事件的发生。因此,在上述模型基础上,本文又提出了一种基于事件的主题动态关联检测方法,以发现主题之间在不同时刻由于特定事件的发生而产生的关联关系。该方法在先前工作的基础上,加入了主题时序的峰值检测过程,进而能够发现与查询主题在其比较受关注的事件中,与其相关联的其他主题,实现主题关联的动态检测,帮助用户更好的了解该主题在一段时间内的发展变化情况。   4、提出了一种面向网络热点事件主题的微博客用户情感分析方法,用于分析和监洲微博客内容中所包含的用户情感信息,了解民众对特定热点事件主题的关注程度和情感变化,从而辅助评估和掌握事件的发展状况。该方法首先自动挖掘用户对某热点事件的多个关注点,并针‘对不同关注点进行细粒度的情感分析,最终实现面向网络热点事件的情感趋势监测。
其他文献
道路交通信息采集在智能交通系统中,担负着提供准确可靠的信息以使整个智能交通系统得以顺利运行的重任。毫米波雷达交通检测系统作为获取路面信息的一种方式,因其特有的优势
遥控型水下机器人(ROV)是当今人类探索海洋环境和开发海洋资源的有力工具之一,然而ROV造价昂贵,设计完成之后对ROV进行的每一次海试,都需要投入大量的人力和物力,而且ROV控制
近年来,观点挖掘领域的研究工作已在实际应用中显示出了巨大的价值。已有的工作主要关注观点本身的提取,如情感倾向、观点持有者、评价对象等,从而帮助人们获得特定信息源对
随着制造业的发展,计算机数控技术已广泛应用于机床制造领域中。同时数控技术也与时俱进。特别是与嵌入式技术的融合,使得嵌入式数控系统兼备嵌入式技术和数控技术结合的巨大优
连续油管钻井技术因其钻井工艺的高效性、灵活性、降低钻井成本、保护环境、应用范围广泛等特点,已逐渐成为石油钻井技术发展的新方向,展现出巨大的发展空间。论文依托的课题
图像分割是计算机视觉中的核心问题之一,是图像分析和理解的基础。传统的数据驱动的分割方法由于自身的局限性,使其分割结果很难满足医学等复杂图像分割应用的需求。因此,迫切需
近年来,复杂网络研究受到了不同学科研究人员的广泛关注,其发展极大的促进了人们对现实复杂网络系统的理解。复杂网络研究者普遍认为网络中存在社团结构,即整个网络是由若干个群
目标跟踪在运动目标的视觉分析中占有重要的地位,属于视觉的中层部分。利用目标的跟踪,可以方便地获得目标的运动、姿态、行为参数,为后续高层的行为识别和理解奠定基础。目
学位
数字图像、视频日益成为人们日常生活中离不开的信息媒体。在数字图像的获取、处理、编码、。存储、传输和重建的每一个过程中,图像质量都可能出现变化。如何衡量系统获取、