基于Android平台的微博系统研究与应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:nooneknow7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博中圈子很重要,在圈子中,大家对彼此的关注度强于圈子外,产生的话题相关性也比圈子外高。圈子的构建技术与个性化推荐息息相关。个性化推荐的友好程度决定了用户对微博的直接体验。个性化推荐中采用得最广泛的方法是聚类分析。然而传统的长文本聚类算法未能考虑微博数据稀疏性的特点,普通的短文本聚类算法又未能结合微博数据自身的特点。针对微博数据的特点,本文提出了一种微博向量构建方法,该方法考虑微博的话题与文本内容,采用向量空间模型,分别从话题和微博文本计算其相似度。在计算微博文本相似度时对相似度计算公式进行了调整,当词语位于话题中时其重要程度大幅提升。最后,对话题相似度和微博文本相似度进行归一化处理,得到两条微博的相似度。在相似度计算的基础上,本文提出了一种微博聚类算法。该算法基于标签词汇发现技术,通过标签词汇,不断的将微博数据集划分为不同的簇,使得一个簇包含标签词汇,另一个簇完全不包含标签词汇。反复运用迭代分割法,得到最终的聚类结果。本文采用NLPIR微博内容语料库中的部分数据对MBCA算法进行测试,以FScore值为评估标准,与开源聚类工具包CLUTO中的其他聚类算法进行了对比分析,实验结果表明,MBCA算法的性能优于其他短文本聚类算法。在上述工作的基础上,基于Android平台,采用MBCA聚类算法设计和实现了一款简单的微博系统。软件在基于Android平台的各个版本的模拟器以及ME525等真机上运行状况良好,推荐列表合适,证明了软件设计良好,同时也验证了MBCA算法的合理性。
其他文献
在发射过程中发射装置和火箭弹相互作用会产生振动影响发射精度,本文针对此问题以某火箭武器系统为研究对象,综合运用有限单元法、模态分析法、碰撞控制等理论对发射系统进行
在全球大都市经济圈崛起、区域生态环境恶化、北京"大城市病"逐渐凸显的背景下,2014年2月26日召开了京津冀协同发展工作座谈会,将京津冀一体化问题提上了历史的新高度,由此京
中国(上海)自由贸易试验区自2013年挂牌成立以来,取得了显著成效,福建自由贸易区于2014年也获准建设。该文在梳理上海自由贸易试验区建设经验的基础上,结合福建省自贸区建设
21世纪是海洋开发和利用的新时代,海洋竞争在全国乃至全球范围内激烈展开,能否取得海洋竞争的胜利直接关系到一地或一国的发展。厦门是一座因海而生、凭海而兴的城市,海洋经
汽车产业一直以来都是中国的重要支柱产业之一,在国民经济中占有重要地位,经过多年的发展,无论是企业的生产能力、研发能力还是品牌的多样性方面都取得的很大的进步。但是,这
本文通过分析当前国内金融市场现状并借鉴国外金融市场发展经验,认为银行传统信贷业务仍然具有良好的发展前景,在未来一定时期内仍将是企业融资的主渠道,是银行开展其他金融
随着汽车数量的不断增加和新的车辆技术的不断发展,道路安全已成为各国政府和汽车制造商关注的一个重要问题。在道路安全的紧急需求下,作为智能交通系统最具前景的重要研究领域
文章介绍了云南咖啡产业发展的基本情况,阐述了云南发展小粒种咖啡产业拥有的自然条件、区位、经验等优势,以及目前发展该产业的历史机遇及有利条件,分析了云南咖啡产业发展
车载自组织网络(Vehicular Ad Hoc Networks, VANETs)可以看作是一种特殊形式的移动自组织网络(Mobile Ad Hoc Networks, MANETs),其主要目标是利用汽车节点构建一个自组织的
湖南大学早期建筑,是指湖南大学从古代的岳麓书院向外扩大发展时最初的一批建筑,其中保存完好的共计9栋(二院、科学馆、工程馆、大礼堂、老图书馆、胜利斋、第一学生斋舍、第七