论文部分内容阅读
随着Web2.0时代的到来,人们对信息获取手段和效率提出越来越高的要求。传统互联网的服务模式正在逐渐向主动式、个性化、高效率的转变。个性化服务技术的出现在一定程度上解决了Internet中信息海量增长与用户获取信息手段相对简单之间的矛盾。用户兴趣建模技术作为个性化服务的核心问题,主要研究如何有效地进行用户兴趣的表示、更新、存储以及计算。本文以一个完整的Web个性化信息推荐系统——C&P的实现为背景,完成了以下几个方面的研究工作:①用户行为分析的深入研究。心理学中的内驱力理论说明用户在浏览网页时的行为能确实从某种程度反映用户的浏览兴趣,将这些运用于个性化服务领域我们可以发现用户的浏览行为和用户对网页的兴趣度之间存在某种关系。文献[6]的方法采用多元线性回归的手段对用户行为进行分析,而本文针对这种方法的不足之处进行了改进,提出了分别用Logistic曲线模型和双曲线模型来分析拟合用户的多种不同浏览行为的工具,即非线性的用户行为分析。②设计了一种新的用户兴趣模型。提出采用分级向量的思想描述基于内容的用户特征,并采用上述的非线性用户行为分析描述基于行为的用户特征,同时利用了训练过程中得到的NIC集(Not Interesting Category,用户不感兴趣类)对噪音进一步过滤。基于这三点改进得到一种以多向量树为逻辑结构的新的用户兴趣模型。③基于新型用户兴趣模型设计了一个相应的个性化推荐系统。该系统以新型用户兴趣模型为核心,在个性化推荐的各个环节充分发挥新用户兴趣模型多向量特征描述、非线性行为分析和NIC集过滤噪音的优点。④针对改进的用户行为分析做了充分的实验,以验证并修正拟合用户兴趣的数学模型;进而对基于新用户兴趣模型的个性化信息推荐系统的用户描述能力和个性化推荐能力进行实验,初步实验表明新用户兴趣模型提高了个性化系统的服务质量。如今,个性化服务不管是在学术研究中还是在商业应用中都逐渐成为一个热点。本文研究提出的用户兴趣模型,可以用在用户个性化信息服务领域、客户信息管理、电子商务、以及数据挖掘领域等不同领域。