基于可更新变量选择方法的多因子选股研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:wc836952
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着金融市场的不断扩大和股票市场的有效信息持续披露,能够带来稳定的高于市场收益的投资收益的量化投资理论进入到人们的视线,并广受投资者的关注。当今在股票交易市场里频繁使用到的量化投资模型当中,最受投资者、券商和学者关注的便是多因子选股模型。多因子模型结合运用CAPM和APT两大金融投资理论,即资本资产定价和套利定价理论。该模型主要通过筛选出用于解释股票收益率的有效因子,进而实现投资组合的构建。通过主动的选股持股进行投资组合,完成对超额收益的获取目标。在统计理论、机器学习迅猛发展之下,多因子选股开始对一系列计算机算法加以运用,从而不断更新多因子选股策略。在数据研究工作中,流数据的数据量大、更新速度快、历史数据占用较大内存给研究带来巨大的困难,而可更新估计能够有效解决流数据建模的及时性问题。股票数据的更新速度也比较快,采用可更新估计分析股票数据是比较有意义的事情。同时在多因子选股研究中,较多学者采用逐步回归法或者加入Lasso惩罚项的办法进行因子筛选,加入Lasso惩罚项的方法在实践中易导致估计有偏以及采用逐步回归法的方法较为冗杂,而具有渐近无偏估计性质的SCAD惩罚函数可更有效快速的进行变量选择,将其运用到量化选股中值得探究。值得注意的是,虽然已有较多学者者对多因子模型优化进行研究,例如增加神经网络、逻辑森林以及添加Lasso惩罚项等,但多数的工作量较大且无法有效利用后续更新的数据信息。由于经典的OLS选股、基于Lasso选股模型和基于XGBoost模型等改进模型固定训练集,而基于可更新变量选择方法(记为“SCAD更新”)的多因子选股模型可储存部分摘要统计量,保留有效信息减少内存的同时根据该模型的特点可滚动式的更新训练集。因此本文考虑将结合变量选择的可更新估计进行多因子选股研究。本文研究对象是沪深300成分股,先后采用OLS多因子选股模型、基于Lasso选股模型和基于可更新变量选择(SCAD更新)的多因子选股模型进行选股实证研究。前者运用中,将Fama-Macbeth检验和相关性检验应用于筛选因子阶段,通过前向回归方法对冗余因子进行剔除,得到相关的有效因子,并就此建立OLS选股模型。在建立基于可更新变量选择的多因子模型时,通过批次数据的更新带来参数估计和参数选取的更新来构建选股模型。在实证回测阶段,股票收益预测中对三种模型均进行了运用,基于预测收益率情况,从中筛选出15名股票,然后完成投资组合构建。在动态组合持股33期后,对五种模型相应的表现加以比较。由此发现:(1)就沪深300基准相对而言,这五种模型带来的收益都较为客观,进而看到国内股票市场中这五种模型的可行性以及有效性;(2)从综合表现方面分析,收益上相比于基于可更新变量选择选股模型而言,Lasso选股、多元回归模型、SCAD选股和XGBoost选股较低,同时基于可更新变量选择选股模型的风险组合较低,选股模型更加稳健,胜率更高。
其他文献
随着互联网行业的快速发展,并购逐渐成为互联网公司扩大资本、抢占市场、控制资源、跨越行业壁垒的重要手段。然而因为互联网企业资产较少,盈利性较强的特点,在价值评估时常采用收益法,主观性较强,由此产生了高溢价并购现象。因为信息不对称,并购方对标的资产未来盈利能力不抱有足够的信心,一旦标的方经营状况恶化,并购方需要就标的资产计提大量的商誉减值准备,这将对并购方财务报表、企业形象产生恶劣的影响。为尽量避免信
当前我国经济正经历着深层次的结构调整,经济下行的压力产生的多种经济与社会矛盾已经向商业银行传导,对商业银行的内部审计能否高效履职带来了巨大挑战。我国的地方商业银行在国民经济发展中扮演着关键的角色,内部审计作为内部控制的第三道防线,其内审质量的优化成为了地方商业银行必须解决的新兴论题。我国商业银行风险案件不断发生,特别是地方商业银行本身抗风险能力弱,不良贷款率持续攀升,许多问题屡查屡犯,揭示出地方商
根据我国刑法第262条之二的规定,组织未成年人进行盗窃、诈骗、抢夺、敲诈勒索等违反治安管理活动的,构成组织未成年人进行违反治安管理活动罪。但自本罪设立以来,我国理论研究中对本罪罪状描述中存在的例示概括性词“等”字的解释结论仍然存在较大的缺陷,影响本罪在司法实践中的具体适用。本文首先从语言学及立法现状上对“等”字进行了整体分析。语言学上,作为例示概括性词的“等”字通常在解释中取列举未尽之意;立法上,
授信是指商业银行向非金融机构客户直接提供的资金,或者对客户在有关经济活动中可能产生的赔偿、支付责任做出的保证,包括贷款、贸易融资、票据融资、融资租赁、透支、各项垫款等表内业务。授信业务是商业银行贷款业务发展到一定阶段产物。由于企业取得银行授信之后可以在授信额度限定内自由的进行操作,相应也带来一定风险。目前,国内商业银行对于授信业务风险管理还普遍处于摸索阶段,无论审查前信息搜集、审查环节还是放款后风
担保制度的雏形,始于古希腊时期,在当时的商品交换过程中,满足人们保障交易安全的需求。我国古代秦汉时期,社会上就出现物“质”,即以物作质担保债权。在社会经济发展进程中,担保制度单一的保障债权实现的功能得以突破,其融通资金的功能逐渐凸显。我国进入21世纪后,经济迅速发展,企业在寻求融资过程中,由于银行借贷信贷额度减少、综合成本节节攀高等因素,融资难、融资贵问题严重,同时随着借贷管制的放松,使得众多企业
我们生活在一个由复杂系统主宰一切的世界当中,随着信息技术的快速发展,一方面人类社会的复杂系统基本结构——复杂网络,变得越来越复杂,另一方面人们需要处理的网络数据集变得丰富多样且规模巨大。同时,世界的联系越来越紧密,人类的全球性系统性风险越来越频繁地出现。在此背景下,对复杂网络的相关研究对人类社会防范风险和进一步解放与发展生产力有重要作用。网络结构中的桥对于检测社区结构、研究信息传播规律、传染病的流
随着人们生活水平不断提升,人们对旅游业的需求也随之提升,向不同的用户推荐具有不同特色的景点逐渐成为互联网发展过程中的重要课题。目前旅游景点服务数据种类繁多,游客需要耗费大量精力去选择心仪的景点,这极大影响了用户体验感。为了使用户能够更快速地检索到有用的信息,目前应用较为广泛的是传统的基于评分矩阵的分解,同时运用深度学习对用户的评论信息进行挖掘,均能够提升推荐模型效果。因此,本文提出在矩阵分解方法的
自類書誕生以後,編撰類書就成了歷朝歷代都會進行的一種社會行為。不管是官修的類書,還是私撰的類書,普遍以廣博而著稱,使得眾多不同的文獻能夠大規模地集聚起來,方便人們學習各種知識,也有利于文獻的保存。筆者將隋唐時期的四部類書《北堂書鈔》《藝文類聚》《初學記》《白帖》作為這篇文章的研究對象,由于類書包含的內容比較廣泛,無法對全部內容進行精益求精地探索,更何況是四部類書之間的比較,所以筆者將編寫體例作為一
2008年的金融危机引发各国对加强金融风险防控、改进宏观审慎管理的广泛思考,中国人民银行作为国内维护金融稳定的主体机构,也在积极探索和推进更加全面的宏观审慎管理机制。2011年,人民银行推出合意贷款管理机制和差别准备金动态调整机制,将各商业银行信贷增长的速度和规模,与资产负债水平、资本实力以及我国经济增长的理性需求相匹配,在商业银行资产端强化了控制力度。经过不断地发展探索和对金融市场情况变化的相机
进入21世纪,人们在生活方式、生活状态等方面都出现了巨大的变化,在这样的时代背景下,人们的思想观念也随之改变,对于初中生群体来讲,由于受到日渐开放、多元的社会氛围的熏陶以及生理心理逐渐成熟的影响,很容易出现早恋。在我国的传统文化背景中,“早恋”往往是一个不好的名词,是现代社会家庭、学校甚至社会的一个热点和敏感话题,也是一个不可忽视的重要话题。早恋现象在一定程度上已经影响或者正在影响初中生的正常生活