面向游戏评论的文本信息抽取及整合方法

来源 :吉林大学 | 被引量 : 0次 | 上传用户:jessiemaa18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,电脑游戏行业迅猛发展,不断丰富用户的娱乐生活并产生巨大的经济价值。然而,市场繁荣同样意味着激烈的竞争环境,开发者只有保证游戏的多样化和创新性才能吸引并维持客户,以此维持市场活力。大多数在线游戏平台允许用户评论他们购买的游戏,开发者可以通过浏览玩家评论来了解用户对游戏的看法。从而在修复游戏漏洞的同时不断迎合用户需要的改变,提高用户对游戏的感知质量。目前,针对评论中信息的抽取方法主要集中在特征提取或是关键词集群的查找。然而,无论是哪种方法都不能准确的提取出游戏评论中的信息。区别于一般产品的评论数据,游戏评论有着其独有的特点:一方面,游戏包含更多的领域知识和独有词汇,用户所描述和表达的评论需要基于游戏内容方能理解;另一方面,游戏评论所包含信息更为丰富复杂,其中常会涉及到游戏情节、人物、道具等多方面内容,增大了评论数据的分析难度。面对上述困难,现有方法未曾给出合理的处理方式,导致评论信息抽取难以取得理想效果。以往的信息提取算法无法以游戏的理解来提取相关信息。因此,游戏开发者急需一种针对游戏评论的数据分析方法。针对上述问题和难点,本文设计出一种面向游戏评论的信息抽取及整合方法。在帮助开发者了解用户想要增加的功能的同时,发掘游戏中存在的问题,为进一步提升游戏质量提供信息支撑。首先,针对游戏评论中出现的大量冗余、误用数据的问题,先训练基于关键词的文本二分类器,对数据进行初步过滤,得到有用信息的数据集合。其次,考虑到游戏评论中所包含的较为复杂的信息,进一步将评论分为四类,从而提升数据的可理解性。最后,针对每类评论数据,我们给出基于语法分析的信息抽取规则,获取其中主要信息内容,并通过聚类对相同信息进行汇总,同时定义信息价值的量化排序算法,进而给出结果的可视化展示方案。由此,开发者可以依据自身要求对信息进行快速查询理解,更好的了解用户对游戏的认知及要求,从而针对性的进行产品升级,提升用户的游戏体验。
其他文献
随着经济的飞速发展,汽车惠及大众的同时也引发了大量的交通事故。汽车高级驾驶辅助系统和无人驾驶技术在辅助驾驶和提高行车安全方面具有极大潜力,因此受到了广泛关注。车道线检测作为汽车高级驾驶辅助系统和无人驾驶中基础且重要的部分已经成为研究热点领域,但在弯道检测、“无视觉检索”等方面仍需进一步研究。基于传统的车道线检测方法一般先进行一系列图像预处理,然后再根据提取到的图像特征进行车道线拟合,输出检测结果时
近年来,汽车保有量在逐年递增,但是相应的停车资源却增长缓慢,同时现有停车资源并没有得到充分的利用,这使得停车难问题愈加严重。因此可以通过提高停车资源的利用率来缓解停车难问题。本文设计实现了一个共享停车资源信息的服务平台,为驾驶员停车提供参考信息,以提高停车资源的利用率。平台采用前后端分离架构,使用Django和DRF作为后端开发框架实现平台后端功能服务的各项业务逻辑;使用Vue和uni-app作为
随着经济的飞速发展,国人的生活水平迅速提高,人民对医疗健康领域话题的关注度日益增多。检索式医疗问答系统作为问答系统的子领域,可以根据用户提出的医学问题检索知识库,给出专业的医学答案,具有极其重要的研究与应用前景。典型的检索式问答系统主要包含召回模块与排序模块两个关键模块。在排序模块中,使用深度语义匹配模型对召回的数据重排序,深度语义匹配模型的性能直接影响到检索式问答系统的性能。因此,检索式问答系统
互联网信息时代下,就计算机应用而言,以结构化和非结构化形式存储并用于语言文字的信息处理占比十分巨大,在神经网络广泛应用于自然语言处理任务之前,命名实体识别领域的研究通常集中在利用词汇和句法知识来提高模型或方法的性能。随着低资源的命名实体识别任务成为主流方向,作为应对的手段之一的迁移学习也逐渐成为热门的研究方向。跨领域迁移学习是一种可以将知识从高资源领域传递到低资源领域来弥补数据信息不足的技术,在处
随着人工智能和大数据的飞速发展,无人驾驶技术在全世界掀起研究热潮,吸引了社会各界高度关注。无人驾驶技术分为环境感知、行为决策、路径规划以及路径跟踪四个部分。其中,路径跟踪部分控制车辆准确地遵循路径规划部分生成的参考路径,是无人驾驶技术中的重要研究方向。因此,研发跟踪准确性强、实时性高的路径跟踪算法是无人驾驶技术研究的重点工作。纯追踪算法是自动驾驶汽车中最有效的路径跟踪方法之一。与其他路径跟踪算法相
肺癌的发病率与死亡率全球第一,种类多样,发病机制复杂。目前,肺癌依然存在着预后差、生存率低、早期难以筛查的特点。随着基因芯片技术和数据挖掘技术的迅猛发展,越来越多的高通量组学数据被应用于癌症的研究中。在这种背景下,利用生物组学数据寻找与肺癌相关的特征标志物,为肺癌患者的早期筛查和靶向治疗提供指导,并且探究肺癌的发病机理意义十分重要。然而,大多数生物组学数据都具有维度高,噪音数据多,样本数目过少的特
随着人们对数据的重视程度不断的加深,以及越来越完善的传感器与物联网技术,海量的数据被人类不断的制造出来。而近年来数据规模的爆炸式增长也同时带来了数据安全事件的频频发生,对数据的篡改、销毁、恶意泄露等行为几乎每周都有所报道,对于一些敏感数据如经济数据的恶意篡改甚至会造成严重的经济损失,传统的数据存储系统的安全性隐患逐渐浮出水面,同时大型分布式存储系统的单点故障问题也使得系统的稳定性难以保证。区块链技
近年来,进化算法相关方面的研究得到社会上科研人员的广泛关注和应用。通过进化算法对实际问题的求解提供了很多有效的解决思路,可以利用智能生物的某些行为规律在整个求解空间寻求我们所需的最优解,例如常见的复杂工程问题—压力管问题、汽车定损问题、背包问题、阵列天线优化问题等等。但常见的以往大多数进化算法的优化过程仅仅依赖于目标函数的值,在实际问题中,无论是单目标函数还是多目标函数,这些问题的求解通常需要大量
作为病人疾病检测的重要依据,眼底图像在医学领域有着广泛的使用。眼底图像不仅可以反映出病人眼睛相关疾病情况,而且一些其他全身性疾病也会在眼底图像有着直观的反映,比如高血压、心脏病等。在医疗诊断过程中,对病人眼底进行采样形成的眼底图像,是医生诊断眼底病变的依据,医生通过对眼底图像的判读来分析病人所患病症。相较于从病人眼球中直接提取信息,眼底图像为医生提供了一个更直观、更清晰的判断依据,这使得眼底疾病诊
虚拟现实环境下,文本输入是三维自然交互的一项重要任务.但是现在最通用的常规方法,控制器指向法却存在着各种各样的缺陷,如疲劳程度高,输入速度和准确率低等因素。如何提升虚拟现实中文本输入的效率和体验,已经成为了一个亟待解决的问题。针对上述问题,本文提出了两种新型虚拟现实环境的双手手势文本输入技术,旨在使用改进的手势识别算法,通过HTC VIVE控制器中的触摸板输入文本,同时支持双手输入,充分利用双手交