基于UGC数据的旅游目的地推荐研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:huxianding
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来国内旅游业的快速发展,游客出行人次与旅游目的地数量均飞速增长,旅游在经济发展中扮演重要作用。随着信息技术与旅游业的融合创新,越来越多的游客选择通过互联网与朋友或者陌生人分享自己的旅游经历,这些由一般用户于互联网平台上产生的数据被称为互联网用户产生内容(User Generated Content,UGC)。由于这些海量在线旅游信息的不断涌现,信息质量参差不齐,使得信息的利用效率不断降低、搜索成本不断增高。学者提出推荐系统,有效缓解了此类现象。然而,对推荐系统存在的冷启动问题、数据稀疏等问题的回答并不充分。因此,在技术、方法飞速更新换代情况下,如何应用新技术和新方法优化推荐系统来提高推荐精度和效度成为重点研究课题。  本研究在非电子商务模式下,建立基于本体语义加权的混合推荐模型。在基于项目描述上实现本体结构的构建,通过分析本体概念的语义关联度,对项目相似性结果进行加强。同时,加入基于用户人口统计信息的推荐方法。通过BP神经网络训练两种推荐方法实现加权共同混合推荐的最优权值。最后,以桂林为例,使用protégé软件建立桂林旅游目的地领域本体,利用网络爬虫爬取蚂蜂窝平台用户UGC数据10000份,分为4组训练集和1组测试集进行分析,并与基于人口统计学信息的推荐方法、基于本体语义相似的推荐方法以及目前应用较广泛的协同过滤推荐方法的结果进行比较,通过平均绝对误差(MAE)与预测覆盖率(COV)值来检验各种方法的推荐效率。  研究表明:单独的基于人口统计学的推荐方法推荐精度低且稳定性差,但是结合单独表现较优异的基于本体相似度的推荐方法,形成的本文算法具有很好的稳定性,并且平均绝对误差(MAE)与预测覆盖率(COV)值表现优异。
其他文献
随着网络和信息技术的迅速发展和不断进步,越来越多的生鲜农产品供应商开拓了网上直销渠道,但也由于采用网上直销渠道与传统零售渠道并存的营销模式,加剧了供应商与零售商之间的
现代公司遵循企业伦理(Busniess Ehties)不仅是道德的约束,更是法律的规定。企业的不道德行为危害甚大,不仅会对企业产生法律风险,对社会公众产生恶劣影响,也会衍生企业自身的金
缺陷在系统开发过程中是不可避免的,为了减少缺陷对系统造成的负面影响,进行缺陷管理是一种行之有效的方法。本文针对传统缺陷管理的不足,考虑到缺陷度量在系统开发过程中的重要
在对工程项目风险分析与风险管理研究的基础上,结合大型水电工程项目风险特征,采用系统工程理论、概率论及模拟技术等,对工程项目投资与财务风险分析理论与方法进行了研究.主
网络流问题在理论研究和实际应用中都受到广泛的关注,多物资流问题是网络流问题中的一个重要研究领域.多物资流的迅速发展及其广泛的应用领域导致越来越多的人致力于对其进行理
自愿性信息披露是上市公司在满足政府最低限度的强制披露要求以外,为了改善与投资者及其他利益相关者的有效沟通,向市场传递企业价值和未来发展前景而主动披露信息的行为。已
高等教育评估中的偏差研究是伴随高等教育评估而出现的研究领域.教育评估是在教育测量基础上的价值判断,而教育测量和价值判断的过程中都会产生偏差,可以说,偏差是与教育评估
本文基于模糊结构元表述理论,对生产管理中一类模糊参数系统的可靠性进行了分析研究,有效地解决了在传统模糊可靠性分析中,常常遇到的基于扩张原理的大量模糊数运算带来的复杂性