论文部分内容阅读
近年来国内旅游业的快速发展,游客出行人次与旅游目的地数量均飞速增长,旅游在经济发展中扮演重要作用。随着信息技术与旅游业的融合创新,越来越多的游客选择通过互联网与朋友或者陌生人分享自己的旅游经历,这些由一般用户于互联网平台上产生的数据被称为互联网用户产生内容(User Generated Content,UGC)。由于这些海量在线旅游信息的不断涌现,信息质量参差不齐,使得信息的利用效率不断降低、搜索成本不断增高。学者提出推荐系统,有效缓解了此类现象。然而,对推荐系统存在的冷启动问题、数据稀疏等问题的回答并不充分。因此,在技术、方法飞速更新换代情况下,如何应用新技术和新方法优化推荐系统来提高推荐精度和效度成为重点研究课题。 本研究在非电子商务模式下,建立基于本体语义加权的混合推荐模型。在基于项目描述上实现本体结构的构建,通过分析本体概念的语义关联度,对项目相似性结果进行加强。同时,加入基于用户人口统计信息的推荐方法。通过BP神经网络训练两种推荐方法实现加权共同混合推荐的最优权值。最后,以桂林为例,使用protégé软件建立桂林旅游目的地领域本体,利用网络爬虫爬取蚂蜂窝平台用户UGC数据10000份,分为4组训练集和1组测试集进行分析,并与基于人口统计学信息的推荐方法、基于本体语义相似的推荐方法以及目前应用较广泛的协同过滤推荐方法的结果进行比较,通过平均绝对误差(MAE)与预测覆盖率(COV)值来检验各种方法的推荐效率。 研究表明:单独的基于人口统计学的推荐方法推荐精度低且稳定性差,但是结合单独表现较优异的基于本体相似度的推荐方法,形成的本文算法具有很好的稳定性,并且平均绝对误差(MAE)与预测覆盖率(COV)值表现优异。