摘要:
股指期货自推出就受到投资者和学者的广泛关注,无论是作为风险对冲的工具,还是通过制定交易策略获取超额收益,都需要对其价格进行科学合理的预测。但因其受到金融市场中各种内外部复杂因素的影响,往往显示出非线性性和不稳定性,具有一定的预测难度。现如今大数据的主导地位愈加明显,加上人工智能技术的革新,将机器学习,深度学习等算法应用于股指期货的预测分析成为研究的突破点。基于此,本文提出一种将长短期记忆网络LSTM与轻量级梯度提升树Light GBM相结合的组合模型,以期提升价格预测的准确性。本文共包括四个部分,首先在导论中介绍了研究背景及意义,并从股指期货价格的影响因素与证券市场的价格预测方法两个方面对国内外相关文献进行总结,最后梳理了研究思路。第一章介绍了股指期货及底层模型LSTM,Light GBM的相关理论知识,其中,股指期货价格可测理论是本文展开研究的基础。第二章首先从内外部因素考虑,选择28个初始特征指标,对原始数据进行预处理后,以6个互不相关的主成分及收盘价作为新的特征变量,并确定以均方根误差RMSE,平均绝对百分比误差MAPE,涨跌预测准确率(8(8(6(8作为后续模型的评价指标。然后选取沪深300股指期货主力合约日数据进行实证分析,将时间窗口设置为5天,分别构建LSTM模型和Light GBM模型,并将网格搜索与时序交叉验证法结合,对Light GBM模型进行参数调优,分析两模型的预测结果。
第三章分别使用简单加权法,残差倒数法,岭回归集成法对单一模型进行组合,将预测结果与单一模型进行对比,并选用上证50股指期货对组合模型的泛化性进行检验,最后将预测结果应用于交易策略中。研究结果表明,单一模型中,LSTM模型和Light GBM模型均能很好地刻画股指期货价格的走势,从预测误差和涨跌预测准确性来看,LSTM模型的准确率相对来说都更高,且预测更偏向于保守型。组合模型中,由岭回归法集成的模型表现最优,能够最大限度的结合单项模型的信息,达到提升预测精度的效果,并且相对于另外两种线性加权法,更具有一定的普适性。对于沪深300股指期货,其RMSE相较于两种单一模型分别降低7。45,14。49,在以上证50股指期货展开的泛化性检验中,其RMSE相较于单一模型分别降低3。55,8。16,在涨跌的预测准确率方面,组合模型也有不同程度的提升。同时,本文还通过岭回归集成的LSTM-Light GBM组合模型的预测结果,构建日间单边交易策略,验证了其在预测精度提升方面的有效性以及在实际投资应用中的可行性,有利于投资者进行理性决策。
展开
文章原创于外盘期货官网:http://www.haoyaya.com.cn/