基于文本挖掘的中国电影票房预测模型的构建与验证

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:shinetar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电影产业是我国文化产业的重要组成部分,其产业环境得到持续性改善,电影产业的蓬勃发展彰显了我国文化自信,为我国的文化软实力做出了巨大贡献。我国电影票房从2003年到2017年实现了9亿到560亿的快速增长。电影产业迅猛的发展势头吸引了各类投资者进军,但是电影产业也是一个高风险行业之一,高收入伴随了高风险。由于电影票房具有高风险性和不确定性,因此,需要对电影票房影响因素进行识别分析,并对电影票房进行预测指导电影投资者以及相关利益者进行投资拍片。目前国内有关电影票房影响因素的研究大多停留在对于电影自身内在因素研究,数据维度较为单一。随着互联网的发展,网络口碑对于商品销量的影响也是越来越显著,电影作为特殊的一次性消费商品,也是需要将外部因素中的网络口碑因素纳入到电影票房影响因素中进行分析。另外,电影上映的生命周期通常在两周以上,票房是随着时间变化而逐步递增的,在上映期间会受到用户评论的影响。但是目前对电影票房的预测是直接预测最终的票房,直接预测的结果会和实际票房差异比较大。本文对前人对网络口碑和电影票房相关的研究理论进行梳理分析,结合对电影评论进行文本挖掘得到的内容对电影票房的影响因素进行识别。使用网络爬虫对研究数据进行收集,使用文本挖掘技术对收集到的猫眼评论进行了情感挖掘,使用2016和2017年两年在国内上映的电影并结合识别的电影票房影响因素建立了首日电影票房和最终电影的多元线性回归和BP(Back Propagation)神经网络的预测模型,并对模型的结果进行分析和稳定性检验,最后在2018年上映的电影验证了模型效果。实验结果表明,多元回归模型和BP神经网络模型对于首日票房和最终票房的拟合程度都较好。当在2018年上映的电影验证时,对于首日电影票房预测,当去除首日票房在500万以下的电影后,多元回归模型误差率为29.98%,BP神经网络的模型误差率为25.58%;对于最终电影票房预测,多元回归模型和BP神经网络的模型均在20%左右,前人对电影最终票房的预测误差率集中在20%-25%这个区间,本研究建立的预测模型效果与前人相接近,并且本文使用的验证样本更多,更能说明建立的最终电影票房预测模型的预测效果更稳。从总体上看,BP神经网络模型的预测效果要优于多元回归模型,模型结果对于电影投资者、电影院线有一定参考价值。最后,本文根据实证分析的结果,从电影制作和营销发行这两方面提出了提高电影票房的对策与建议,从电影制作方面提出的意见是丰富电影类型、创新电影技术效果、提升电影主创阵容、提高剧本创作水平以及打造系列品牌电影这五点,从营销方面提出的建议是选择合理上映档期、改善电影网络评分以及提升电影网络口碑关注度这三点。
其他文献
多头命悬2132 点一线  本周沪指探低2138点摸高至下行的20日均线受阻有回落,多空双方关于沪指的“腰底之争”(参见本刊今年第27期拙文《底部还是腰部》)进入白热化,双方在沪指今年1月6日低点2132点一线大打出手。多方要力守2132点不失,方能使沪指季线图上近4个季度的横向窄幅整理定性为底部整理成为可能;同理,空方要奋力向下击穿沪指2132点,方能使上述整理定性为具下跌中继味道的腰部整理成为
目的探讨环尔康在细菌性阴道病(BV)治疗中的疗效.方法将确诊为BV者随机分成三组,A组(50例):口服替硝唑500mg,每日2次,共6天;B组(50例):甲硝唑栓(每枚含甲硝唑500mg)阴道用药,
采用密度泛函理论(DFT)方法研究了在还原剂(EtO)3SiH存在下,铜(I)(Cl2IPrCuF)催化CO2插入1-苯基丙炔生成α,β不饱和羧酸的反应机理.计算结果表明,Cl2IPrCuF首先与(EtO)。SiH生成活性催化剂
近年来,在国家的高度重视下,民族教育取得了丰硕的成果,但是民族地区以数学为龙头的理科教育仍是民族教育发展的瓶颈。因此,深入了解民族地区小数数学课堂教学的现状,对破解
艾滋病(AIDS)是获得性免疫缺陷综合征(acquired immunodeficiewy syndrome , AIDS)英文缩写的音译.由于该病传染性强、死亡率高号称'超级癌症'.AIDS与1981年美国首次
目的了解血透及不同透析膜对尿毒症患者IL-8血浆水平及基因表达的影响.方法采用酶联免疫吸附试验(ELISA)测定IL-8血浆水平,逆转录多聚酶链反应(RT-PCR)检测基因表达.结果正常
本书尝试着从中国文人和中国历史文化发展状况。这二十几位的文人中,李清照和辛弃疾所经历的年代是历史动荡的南宋。通过“辛弃疾”和“李清照”的翻译,我们体会到当年历史动
对浸泡、蒸煮、干燥等湿热处理对蒸谷米品质的影响进行了研究。结果表明,采用酸醇分步浸泡、高压蒸煮和高温高湿干燥相结合的新工艺生产的蒸谷米维生素B2 的含量较高,且产品
蔷薇科物种有着重要的经济价值,包含了许多重要的果树和观赏性植物,比如草莓、黑树莓、苹果、梨、桃和玫瑰。然而果树的栽培过程中,经常会遭受各种各样的逆境胁迫,比如干旱、