论文部分内容阅读
电影产业是我国文化产业的重要组成部分,其产业环境得到持续性改善,电影产业的蓬勃发展彰显了我国文化自信,为我国的文化软实力做出了巨大贡献。我国电影票房从2003年到2017年实现了9亿到560亿的快速增长。电影产业迅猛的发展势头吸引了各类投资者进军,但是电影产业也是一个高风险行业之一,高收入伴随了高风险。由于电影票房具有高风险性和不确定性,因此,需要对电影票房影响因素进行识别分析,并对电影票房进行预测指导电影投资者以及相关利益者进行投资拍片。目前国内有关电影票房影响因素的研究大多停留在对于电影自身内在因素研究,数据维度较为单一。随着互联网的发展,网络口碑对于商品销量的影响也是越来越显著,电影作为特殊的一次性消费商品,也是需要将外部因素中的网络口碑因素纳入到电影票房影响因素中进行分析。另外,电影上映的生命周期通常在两周以上,票房是随着时间变化而逐步递增的,在上映期间会受到用户评论的影响。但是目前对电影票房的预测是直接预测最终的票房,直接预测的结果会和实际票房差异比较大。本文对前人对网络口碑和电影票房相关的研究理论进行梳理分析,结合对电影评论进行文本挖掘得到的内容对电影票房的影响因素进行识别。使用网络爬虫对研究数据进行收集,使用文本挖掘技术对收集到的猫眼评论进行了情感挖掘,使用2016和2017年两年在国内上映的电影并结合识别的电影票房影响因素建立了首日电影票房和最终电影的多元线性回归和BP(Back Propagation)神经网络的预测模型,并对模型的结果进行分析和稳定性检验,最后在2018年上映的电影验证了模型效果。实验结果表明,多元回归模型和BP神经网络模型对于首日票房和最终票房的拟合程度都较好。当在2018年上映的电影验证时,对于首日电影票房预测,当去除首日票房在500万以下的电影后,多元回归模型误差率为29.98%,BP神经网络的模型误差率为25.58%;对于最终电影票房预测,多元回归模型和BP神经网络的模型均在20%左右,前人对电影最终票房的预测误差率集中在20%-25%这个区间,本研究建立的预测模型效果与前人相接近,并且本文使用的验证样本更多,更能说明建立的最终电影票房预测模型的预测效果更稳。从总体上看,BP神经网络模型的预测效果要优于多元回归模型,模型结果对于电影投资者、电影院线有一定参考价值。最后,本文根据实证分析的结果,从电影制作和营销发行这两方面提出了提高电影票房的对策与建议,从电影制作方面提出的意见是丰富电影类型、创新电影技术效果、提升电影主创阵容、提高剧本创作水平以及打造系列品牌电影这五点,从营销方面提出的建议是选择合理上映档期、改善电影网络评分以及提升电影网络口碑关注度这三点。