用户兴趣模型建模方法研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:zxd19811219
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解模式的非平凡过程。其应用于网络环境中则称为Web数据挖掘(Web Data Mining)。Web数据挖掘是从Web中相关资源和用户浏览行为中抽取感兴趣的、有用的模式和隐含的信息。Web使用挖掘是Web数据挖掘的一种,挖掘的对象是用户在Web服务器上的信息,通过用户兴趣建模算法建立用户兴趣模型,挖掘用户兴趣,为用户提供更好的浏览体验。在众多的建模方法中关联规则和马尔可夫模型是两种非常重要的建模方法。本文对关联规则以及马尔可夫模型的相关算法进行系统的分析和总结,然后再此基础之上提出了新的建模方法:首先,提出了基于最大频繁项目集的事务间关联规则的挖掘算法,由改进的Mafia算法,得到最大频繁项目集的同时得到对应的共有用户集,对事务内到事务间最大频繁项目集的转换,分析不同用户之间的关系及用户对网站上不同网页的访问情况,直接发现不同用户之间的关联关系来预测用户的兴趣。该方法经实验证明能够更加全面的预测用户感兴趣的网页,更好的为用户提供个性化服务。其次,在基于最大频繁项目集的挖掘事务间关联规则的算法的基础之上,结合两种建立用户数据库的方法,提出基于二阶马尔可夫模型与事务间关联规则的用户兴趣预测模型。另外,本文以用户指向思想为核心,通过分析用户之间的关系从而映射到有相同兴趣用户所对应的数据上,使找到的结果相对之前数据指向的结果更加符合用户的需求。改进的Mafia算法,使得这种最大频繁项目集的算法能够记录找到的最大频繁项目集中的项目在原数据中事务号的交集,从而方便使这种算法作用于事务间关联规则成为可能。加入马尔可夫模型,将事务间关联规则与2阶马尔可夫模型的结合起来,使事务间关联规则的挖掘结果准确性大幅度提高。在实际问题中,不同数据之间存在着一定的联系,关联规则就是用来找到这些联系的方法。但是随着数据量的增多,数据冗余和结果准确度之间的矛盾凸显,所以采用事务间关联规则来完善结果的准确性,同时加入马尔可夫模型的方法来解决数据冗余的问题,通过实验证这种结果是有效的。
其他文献
海量的自然场景图像需要被快速检索、分析,这要求能够快速准确的对这些图像进行自动图像分割。由于自然场景图像具有光照不确定、背景复杂等特点,使得自然场景图像的分割成为
随着互联网技术的高速发展,计算机网络给人们工作和生活带来了前所未有的便利。同时网络安全事件发生频率越来越高,其中恶意代码攻击事件日益突出,给人们的数据安全带来极大
随着经济、社会的发展,人民群众休闲娱乐需求日益扩大,娱乐场所随之日益增多,然而这些场所确实存在许多安全隐患。2008年9月,深圳某歌舞厅特大火灾造成43人死亡、50余人受伤,再次
虚拟仪器软件体系结构(Virtual Instrumentation Software Architecture,简称VISA)是标准化的I/O函数库及相关规范的总称,它屏蔽了用户对于硬件接口的直接操作,是计算机与仪
随着计算机硬件以及其外围设备的飞速发展,如何逼真的模拟自然景物,成为图形学领域中最具有挑战性的研究方向之一。目前为止,非常逼真的流体可以加入到具有真实感的交互式应
细分方法因其与传统样条方法相比有多方面的优势,已经在科学计算可视化、计算机动画、医学图像处理和工业制造逆向工程等领域得到广泛重视和应用,成为一种流行的离散化的曲线曲
随着经济社会的高速发展和城市化水平不断提高,各类突发公共事件造成的影响和波及范围也越来越大,如何合理配置应急资源,在突发事件发生后提供快捷的紧急救助服务,最大限度发
社会医疗保障制度作为一项关系到国计民生的制度,一方面在保障全体劳动者健康,免于伤病威胁方面发挥了重要的作用;另一方面,由于医疗过程缺乏有效的行为规范和标准化,违规现
随着信息化建设的迅速发展,越来越多的应用需要访问多种异构数据源。这些数据源由于地理位置分布不同、所处平台及操作系统不同、采用的数据库模式不同、数据语义表示的不同
随着信息技术的不断发展,数据信息逐步呈现海量、多样、非结构化的特点。而传统的数据库技术已不能够对这些复杂数据进行有效的管理,新的数据管理模式——数据空间应运而生,