基于随机森林算法的IMDB电影评分预测研究

来源 :现代计算机 | 被引量 : 0次 | 上传用户:peking521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文采用“数据世界”官网的IMDB电影数据集,该数据集涵盖66个国家、跨越100多年的5000多部电影,含有影片时长、导演、票房、成本等28个变量,其中“imdb_score”为响应变量,其它为预测性变量.本文针对上述数据集通过数据分析处理,采用数据挖掘技术中的随机森林算法以及BP神经网络进行评分预测和性能检验.最后,基于最优的随机森林预测模型对15部新电影评分进行预测,预测结果良好.在IMDB电影排行榜中,得分越高(满分10分)则代表影片越精彩,值得观看.本文研究目的是预测精彩有意义的电影,节省时间满足大众观影者的观影需求,同时为电影推荐系统提供可行性建议.
其他文献
在我国经济不断发展的过程中,中小学等基础教育设施和理念也有所改变.目前,缺乏完善的中小学公共接送制度,都是家长接送学生,在上下学的时候校门口与周边人流量、车流量比较大,从而导致出现交通拥堵,造成资源浪费和社会消极影响.通过对中小学接送车辆的需求进行分析,提出校园交通组织管理的对策.
伴随着人工智能、物联网以及通信技术的发展,自动驾驶汽车也被提上日程.传统汽车的测试工具和方法已不能满足自动驾驶技术升级带来全新的测试需求.基于交通场景数字孪生的测试方法在测试效率、测试成本和安全方面具有巨大的优势,是未来自动驾驶测试的重要手段,并成为自动驾驶领域的一个重大研究方向.在调研大量文献的基础上,首先从测试安全的角度,阐述虚拟交通场景对自动驾驶测试的重要性;其次,对数字孪生技术进行综述,主要包括数字孪生的概念介绍、数字孪生技术的主流应用、数字孪生技术与传统仿真的区别;再次,将数字孪生应用于自动驾驶
针对配对交易策略目前存在的套利空间小、投资收益低等问题,本文基于强化学习算法构建配对交易策略,并以2010-2016年期间美国公共事业股的收盘价作为研究对象,验证配对交易策略的投资绩效.研究结果表明,相较于传统的配对交易策略,基于强化学习算法的配对交易策略避免了经验参数对于交易结果的不利影响,可以更好的捕捉潜在的交易机会,在夏普比率、年化收益率等指标上表现更加优异,因而将强化学习算法引入配对交易当中可以为投资者提供一种有效的套利手段和风控工具.