论文部分内容阅读
本文采用“数据世界”官网的IMDB电影数据集,该数据集涵盖66个国家、跨越100多年的5000多部电影,含有影片时长、导演、票房、成本等28个变量,其中“imdb_score”为响应变量,其它为预测性变量.本文针对上述数据集通过数据分析处理,采用数据挖掘技术中的随机森林算法以及BP神经网络进行评分预测和性能检验.最后,基于最优的随机森林预测模型对15部新电影评分进行预测,预测结果良好.在IMDB电影排行榜中,得分越高(满分10分)则代表影片越精彩,值得观看.本文研究目的是预测精彩有意义的电影,节省时间满足大众观影者的观影需求,同时为电影推荐系统提供可行性建议.