社交网络热点推荐算法的研究与应用

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:gdat86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络作为人与人之间关系网络化的社交平台是提供信息交流与分享重要途径,社交网络正在以它们自己的方式改变人们的交流与学习。由于社交网络在广大网络用户的使用,在海量社交数据挖掘出用户关注的热点话题,成为目前研究的主题。社交网络热点话题推荐是利用社交网络用户之间交流的海量话题数据进行数据挖掘,最终将挖掘和分析后的热点话题展现给用户。当前社交网络与传统网络媒体相比,消息文本包含有稀疏性、高维性、网络用语不规范等特点,而且随着交流的海量信息,导致传统的热点话题挖掘技术直接使用于社交网络中存在着效率低与准确度低的问题。本文主要针对使用朴素贝叶斯分类算法与K-means聚类算法存在的一些缺陷做出研究与分析,并对于以上算法做出改进。本文主要对以上问题做出以下几点工作:(1)本文针对现代社交网络特点的分析与研究,详细描述了从社交网络交流数据发现热点话题,通过对交流数据预处理获得有意义的数据,将处理完成的数据使用分类算法对数据进行分类,然后将分类完成的数据通过聚类算法发现热点话题。(2)在社交网络热点话题推荐中使用朴素贝叶斯分类算法存在准确度与效率问题,因为朴素贝叶斯分类是利用生成判定条件的方法来实现分类,因此具有较高的分类准确度和处理速度。但是,由于朴素贝叶斯分类模型计算的类别概率可能很接近,不能明确具体类别,难于应用于热点话题推荐。本文提出基于朴素贝叶斯分类的热点文本选择算法,作为对社交网络中热点话题的文本选择算法。该算法首先使用朴素贝叶斯分类器计算文本属于各种热点话题的概率,计算标准差值决定该文本所属类别的差异性,决定该文本是否淘汰。(3)针对传统K-means算法在对随机选择初始聚类中心点的缺点,本文提出基于K-means初始聚类中心选择算法是根据数据的稀疏性特征来初始化聚类点,它首先计算各点周围的数据的聚集程度,并通过最小距离公式和邻近相关点的聚集程度的均值来选择数据密集程度比较高的k个点作为聚类中心的初始点。
其他文献
<正>近年来,中国在生物多样性保护方面取得了一系列成就,但由于人类对自然资源的不断索取和全球变化,一些野生植物仍面临灭绝的风险。目前,仅有1999年国务院批准的《国家重点
依据现场经验法、规范要求、矿方施工要求三个因素对大断面硐室进行锚杆支护参数设计,并通过现场实际施工验证了锚杆支护参数设计的合理性,节约了成本,减小了劳动强度,加快了
目的:探讨免疫组化检测在乳腺癌患者诊治中的价值。方法:随机选取2011年1月-2013年1月的68例经过空心穿刺活检并病理确诊的乳腺癌患者为研究对象,均采用免疫组化检测ER、PR、
在世界范围内,高等教育和高等学校的问责制度逐渐成为社会契约的一个内容,我国高校财务问责也逐渐开始成为受人关注的话题。在我国,政府对高校的深度干预既是影响高校办学活
高中思想政治学科是提升学生思想道德品质、发展学校品德教育的重要渠道之一。高中思想政治教师进行教学设计应当从学科的核心素养出发,通过对课堂的不断完善,达到学科育人的
当今世界,多数民主国家都以宪法或法律对政治宣誓作了明确的规定。政治宣誓制度在中华民国时期业已初步确立,1949年以后因受苏俄模式的影响而中止。近年来,大陆有很多地方出
“虚室生白”出自《庄子&#183;人世间》,意思是空空的房子才能照进太阳,引申为内心清净、澄澈明朗才能悟出“道”来,生出智慧。在幼儿园环境创设中,存在着这样的情况:成人想
从马克思主义中国化的内涵、缘由、进程及经验、理论成果等方面,对近年来马克思主义中国化研究进行综述,并对马克思主义中国化研究中存在的矛盾和问题、研究特点与走向等进行
目的:观察冠心Ⅴ号合剂对冠心病稳定性心绞痛气阴两虚夹瘀型患者的临床疗效。方法:选取60例患者,随机分为2组。对照组30例以西药常规治疗,治疗组30例在对照组治疗基础上加用冠
目的探究阿奇霉素联合鼻窦炎口服液治疗小儿慢性鼻窦炎的临床治疗效果。方法选取该院2011年10月至2013年10月门诊及住院部收治的124例小儿慢性鼻窦炎患儿作为研究对象,按照治