基于神经网络的用户建模和Web信息过滤研究

来源 :西南师范大学 西南大学 | 被引量 : 0次 | 上传用户:fanfanzp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web个性化服务是当前人工智能和信息技术领域研究的热门课题之一。以搜索引擎为主的信息检索技术并没有考虑用户的兴趣、偏好的不同,相同的关键词返回相同的结果。而且返回的结果良莠不齐,用户需在大量噪音中找寻有用信息。用信息过滤技术改进Internet信息检索系统已成为非常重要的研究方向,是个性化服务的基础。 利用用户模型可以更好的进行信息过滤。用户模型(User Model)是对一个类别的用户组或单个用户的描述。基于用户模型,计算机中可以表达、存储、复现用户模糊的、变化的兴趣特征,其中存储的用户信息构成了过滤条件,使得信息过滤更有效。 本文首先分析了目前Internet上个性化文本信息检索的研究和应用情况,以及以模糊逻辑、神经网络为代表的软计算的发展现状。借鉴ANFIS网络,提出了一种将神经模糊网络技术应用到用户建模中,建立个性化自适应用户模型,并应用于Web信息过滤的方法。文中讨论了以下几个关键问题: (1)Web页面和用户兴趣的表达,采用了向量空间模型(VSM),将Web页面映射为向量空间中的内容向量PJ。在过滤之前,由用户输入检索关键词和若干Web页面作为样例,经分词抽取出用户的兴趣向量ui。 (2)信息过滤的目的是将Web页面分为相关Web页面集合R和不相关Web页面集合R。利用术语在R和R中的局部权重的不同,选择权重差别最大的那些术语作为特征术语,以确定和调整向量空间的维度,在降低向量空间维度的情况下,尽量保持模型的准确性。 (3)用户模型结构的建立,(模型的结构辨识)。利用模糊集合理论,建立了一组模糊IF-THEN规则,并用ANTIS网络实现。用户的兴趣向量ui和权重ri作为参数存储到网络中。PJ作为输入变量,输出量是系统对PJ和Ui相关度的评判值 互互RPredj。 ()用户模型参数的优化(模型的参数辨识人 采用的是 Candidat抑ank模式,在“学习一过滤一反馈一再学习一再过滤……”中调整参数。将用户的相关反馈 Ruseh和 Rpedj的差值作为误差信号,采用 Wdro一Hoff算法在线式学习,优化八。当与用户的交互达到一定程度后,进行离线式学习,对冰进行调整。 基于以上讨论,实现了一个基于模糊神经网络用户模型的信息过滤原型系统AUM&IP,并利用该原型系统对gOOgle返回的 Web页面进行过滤。通过过滤前后准确度的比较,验证了该系统的有效性。 本文中的一些思想对类似的应用有一定的借鉴价值。
其他文献
重构技术是近年来随着人们对设计模式的重视而逐渐受到关注的。而地区电网特别是省级电网的自动电压控制也是近年来研究的热点。随着计算机通讯技术的发展,两大热点从理论走向
在VPN领域里,MPLS VPN是一种新兴的VPN实现技术。MPLS VPN简单高效,结合了IP网络和ATM各自的优点,因此有越来越多的商业用户采用它来组建自己的VPN网络,也有越来越多的服务提供商
对于航天型号软件测试来说,量化测试过程、改进测试管理水平、提高测试自动化程度是保证测试质量进而保证产品质量和可靠性的重要途径。测试计划是测试过程的指导方针,测试计划
模型检验是一种基于对系统的状态空间进行穷举搜索的自动验证技术。对并发和实时系统进行模型检验时,状态数目往往随着并发分量和系统中无穷的时间值数目的增加呈指数增长;因
本论文主要介绍了8位精简指令集计算机微控制器(RISC MCU)的设计实现与标准化。该课题来源于十五国防预研项目“SoC在新一代战斗机的应用”。 本课题的主要研究内容为设计一款与Microchip的PICl6CXXX系列微控制器的指令系统完全兼容的,有自主知识产权的标准8位RISC MCU IP软核。 论文主要内容包括以下几方面: 1.根据功能需求以及对PIC16CXXX指令系统
系统开发方法的选择对信息系统建设的成败至关重要,虽然各种方法都有其自身的特点,但也不需要完全分开,本文即对OOIE(面向对象的信息工程,Object—Oriented Information Engineer
XML正在取代HTML成为互联网上信息发布和交换的标准.与HTML相比,XML简单,自我描述,实现了内容、结构和表现三者的分离,更适合于数据表示和交换.近来,XML在各种应用中得到了广
SLA是用户和服务提供商所签署的正式合同,它明确规定了所期望的服务质量的级别,包括所期望的服务的行为和服务质量的参数。当前,许多关键的商务活动依赖于网络、通信和信息服
该文从研究订单生产型企业ERP系统的特点入手,结合某印刷厂开展订单生产型企业ERP应用实践研究.在详细分析了印刷业ERP系统及其计划管理子系统的特点的前提下,提出了一种印刷
随着因特网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找信息就象大海捞针一样,搜索引擎技术恰好解决了这一难题(它可以为用户提供信息检索服务)。目前,搜索引擎技术正成