基于兴趣爱好的好友推荐系统的设计与实现

来源 :东北大学 | 被引量 : 1次 | 上传用户:hjlcd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网普及率的提升,人与人之间的社会交往模式已由传统的社会社交逐渐过渡到在线网络社交。为此,人们致力于开发内容更加丰富、功能更加强大的社交网络工具,以满足用户日益增长的在线网络社交需求。当代社会是一个开放型社会,开放型的社会需要开放的社会交往,因此在网络社交中,每个用户都希望通过社交网络工具组建自己的好友群,试图通过找到一些和自己有相同兴趣的人去分享自己的想法。而要想实现高效、准确的好友推荐功能,就必须要在用户的个人信息、发布消息中挖掘出有效的数据。本文以海量社交网络数据为研究对象,设计并实现了基于兴趣爱好的好友推荐系统。该系统基于MapReduce计算框架实现,利用分布式文件系统HDFS对数据进行存储。系统的其核心功能包括三个部分:一是社交网络数据的分布式存储管理,包括对存储在HDFS中海量社交网络数据的上传、下载、删除、新建文件夹、文件重命名等功能,方便管理员对数据的更新和维护。二是基于兴趣爱好的好友推荐,利用K-Means聚类算法对社交网络数据进行了聚类分析,利用朴素贝叶斯分类方法对社交网络数据进行了分类处理,实现了基于聚类和基于分类的好友推荐功能。三是用户兴趣标签的完善,利用上述两种数据挖掘方法,挖掘出社交网络用户可能隐藏的兴趣爱好标签,为用户完善了个人信息。本文使用大量微博数据对系统进行了测试,包括各功能单元测试和系统功能测试。测试结果表明该系统可靠性高、安全性高、响应时间合理,可以实现高效、准确的好友推荐功能,并能为用户提供直观、友好的交互界面。本文首先介绍了好友推荐方面的国内外研究现状以及相关研究内容,然后从需求和可行性两个方面对系统进行分析,明确了系统需要实现的功能以及系统的可行性。接着对系统进行了设计,给出了系统的总体框架设计和各模块的设计。然后对系统进行了详细设计与实现,给出了具体的设计和实现步骤。在系统实现后对系统进行了单元测试、集成测试与功能测试,并对测试结果进行了展示和评估。最后对系统做出了总结,并给出了不足,指出了未来的工作方向。
其他文献
正值柑橘大量上市之际,四川广元柑橘大实蝇事件引发部分消费者恐慌,造成湖北、重庆、江西、北京等部分主产区和主销区柑橘销售受阻,销量大减,价格大跌。在这次事件中,笔者认为橘农
随着国民收入持续增长,人均收入不断提升,民众开始将目光转移到资产投资方面,通货膨胀也让人们意识到资产保值增值的重要性,居民理财意识愈发强烈,从而给银行个人理财产品迎
本文认为金融危机环境下公允价值面临新的挑战,公允价值不应该被停止使用,特殊环境下我国对使用公允价值的使用应该做相应的调整。
任何人类活动都存在管理,任何人类活动的运营都有其规律,人类活动要快捷和高效达到预期的目的、目标,就必须要正确认识事物活动中的管理和规律的关系。文章从管理是探求规律
根据水泵厂泵站的控制要求,详细地介绍了基于西门子PLCS7-200实现水泵的自动控制,利用综合监控系统,最终实现泵站的无人值守。
“我去发展中国家实地考察,经常是没有经费支持的,但我就是相信眼见为实,实事求是,我自己想要搞清楚是怎么回事,我觉得追求真理是不需要报酬的”,这就是一个踏踏实实用“脚”做学问