论文部分内容阅读
股市预测一直是个经久不衰的研究热点,但由于股票市场本身的复杂性,预测市场走势是件困难的事情。行为金融学的发展表明,市场中的投资者并非完全的“理性人”。在决策过程中,由于认知偏差和情感喜好等心理因素的存在,投资者往往无法做出合理的判断,实际上他们的行为经常出现谬误。随着互联网的飞速发展,越来越多的投资者通过网络搜索信息、交流观点和表达情感,互联网为分析投资者情绪提供了巨量的数据来源。文本挖掘和机器学习等技术的发展,使得我们可以处理大规模的互联网数据,为测度投资者情绪提供了新的方法。在理论、数据和方法都具备的情况下,利用情感分析技术研究投资者情绪与股票市场之间的关系成为可能。本文基于行为金融学理论、利用文本情感分析技术分析投资者情绪、研究投资者情绪与股票价格之间的关系。本文抓取了互联网上大量的上证指数股评数据,利用机器学习等技术分析投资者情绪,以此构建情绪指标。在情绪指标构建完成之后,分析了这些指标的特征,并检验了这些指标与上证指数价格、波动幅度、成交量等的相关性,最后结合历史价格数据与情绪指标建立了上证指数的预测模型。本文尝试使用迁移学习技术提高情感分类模型的准确率。此外,本文提出了一个较为完整的研究框架,在这个框架之下,可以利用投资者情绪指标开发出具有一定实用价值的股票市场预测系统,这也是本文在工程实践上的创新之处。本文构建的看涨情绪移动均线指标与上证指数的相关系数为0.631518,预测模型的准确率为71.3%。这表明,互联网上的投资者情绪与股票市场的走势密切相关,利用投资者情绪预测股票市场的走势是可行的。