论文部分内容阅读
微博客作为一种新型的网络媒体,以其简洁方便的交互方式,受到越来越多网络用户喜爱。用户能够通过微博客平台实时地了解当前的社会热点,关注自己喜欢的主题,并针对这些内容发表和分享自己的观点言论。如何利用微博客的实时性和交互性等特点,从中发现与社会热点事件和网络热点主题相关的内容,从而帮助普通用户、商家、决策部门等从不同角度获取所需要的信息,己成为当前微博客背景下的研究热点。
微博客中的帖子内容简短,信息发布渠道方便多样,使得用户能够随时随地将自己感兴趣的内容分享到微博客平台之中,通过对微博客信息进行自动归类,并发现各类信息之问的隐含关联,能够方便用户对最新的微博客信息进行整体浏览;微博客中的信息能够实时地反应用户当前最关注的内容,而用户在一段时间内的兴趣往往会集中在当前的一些社会热点事件或者热点主题,通过挖掘微博客信息中关注度较高的网络热点,有利于准确了解用户的整体兴趣分布,并能够进一步把握网民兴趣的变化趋势;用户对网络热点的关注体现为时问变化和空问分布两方面,通过发现用户对不同网络热点的关注度随时空变化的相似性,能够挖掘刚络热点之间的关联,使得用户能够了解到与感兴趣热点相关的更多内容;用户在针对感兴趣的热点事件发表帖子时,往往会针对该事件的不同方面发表自己的观点言论,通过对事件的不同角度进行用户情感分析以及情感趋势监测,能够帮助了解民众对特定热点事件的情感变化,从而辅助评估和掌握事件的发展状况。本文以微博客为研究背景,运用网络信息挖掘技术从信息归类浏览、网络热点发现、网络热点关联检测以及针对热点事件的网民情感分析几方面对微博客内容进行分析和研究,主要工作包括如下几个方面:
1、提出了一种基于概率主题模型的微博客内容浏览方法,用于对微博客中包含的信息进行自动归类,并发现各类信息之间的隐含关联关系,方便用户对微博客信息进行整体浏览。该方法基于相关主题模型,通过‘用户-主题-词语’三维关联矩阵的建立,帮助用户快速了解最近一段时间内的主题类别,并查找与其感兴趣内容相关的其他用户作为备选好友,同时计算各类主题之间的关联关系,帮助用户了解更多感兴趣的内容。
2、提出了一种基于用户兴趣的微博客网络热点检测模型,用于抽取一段时间内的网络热点,并通过跟踪特定事件或主题的用户关注程度随时间的变化规律,发现其关注度较高的时段,以此分析微搏用户的群体兴趣变化。该模型通过分析用户发表的帖子信息,建立“用户-主题”的对应兴趣关系,并利用用户之间的好友关联,进一步建立主题之间的兴趣关联网络,最后利用基于链接的排序算法,实现基于用户兴趣的主题热度排序,发现特定时间段内的热点主题。
3、提出了一种基于主题之间时空序列相似性计算的微博客主题关联检测模型,用于发现微博客中所包含的热点主题之间的关联关系,帮助用户了解与自己感兴趣主题相关的更丰富的内容。该模型首先将微博客中的主题表示成相应的时空序列模式,之后计算主题之间的时空序列相似度,从而发现主题之间的关联关系。通常情况下,一个主题在不同时间会与不同的主题产生关联,而这种主题之间的动态关联关系往往是源于某些特定事件的发生。因此,在上述模型基础上,本文又提出了一种基于事件的主题动态关联检测方法,以发现主题之间在不同时刻由于特定事件的发生而产生的关联关系。该方法在先前工作的基础上,加入了主题时序的峰值检测过程,进而能够发现与查询主题在其比较受关注的事件中,与其相关联的其他主题,实现主题关联的动态检测,帮助用户更好的了解该主题在一段时间内的发展变化情况。
4、提出了一种面向网络热点事件主题的微博客用户情感分析方法,用于分析和监洲微博客内容中所包含的用户情感信息,了解民众对特定热点事件主题的关注程度和情感变化,从而辅助评估和掌握事件的发展状况。该方法首先自动挖掘用户对某热点事件的多个关注点,并针‘对不同关注点进行细粒度的情感分析,最终实现面向网络热点事件的情感趋势监测。