上海论文网提供毕业论文和发表论文,专业服务20年。

股指ETF的动量反转效应与收益的可预测性——基于高频交易数据和机器学习模型的实证探讨

  • 论文价格:150
  • 用途: 硕士毕业论文 Master Thesis
  • 作者:上海论文网
  • 点击次数:1
  • 论文字数:38666
  • 论文编号:
  • 日期:2023-03-04
  • 来源:上海论文网

金融论文哪里有?本研究选取了Bloomberg数据库中5分钟频率的上证50ETF、沪深300ETF和中证500ETF数据作为研究对象,参考Fung,Mok andLam(2000)在研究S&P500期货市场和香港恒生指数期货市场反转效应和动量效应的方法,对我国股指ETF日内反转效应和动量效应的存在性进行探究。

1.绪论

1.4本文的创新点

本文的创新之处主要在于,对股指ETF反转效应与动量效应的识别指标——累计日内收益(CAR)进行预测时,引入了集合竞价数据作为预测因子。现有的实证研究在对日内收益进行预测时,基本采用开盘后的信息进行预测,例如Gao等(2018)在检验SPY日内动量效应时,采用开盘后30分钟的收益和收盘前1个小时的收益对收盘前半个小时的收益进行预测。Zhang等(2019)在对上证综指日内动量效应进行研究时,也是利用开盘后每30分钟的收益进行后续时点收益的预测。根据集合竞价的交易规则和流程可知,交易者在非交易时间段内通过不同渠道获取的隔夜信息会在集合竞价过程中释放出来。而股指ETF的日内反转与动量效应正是对隔夜信息过度反应的结果,因此本文在预测累计日内收益(CAR)时创新性地加入了集合竞价数据作为预测因子。

金融论文参考

此外,本文在研究数据的选取和CAR预测模型的构建等方面也具有一定的创新性。在过往的研究中,对于反转效应以及动量效应存在性的研究主要集中于股票和期货等资产标的,且选取的样本多为周度、月度、年度等中低频数据。本文选择的研究样本包括上证50ETF、沪深300ETF和中证500ETF的5分钟高频交易数据,在研究数据的选取上具有一定的新颖性。由于机器学习在价格和收益预测上具有显著优势,故本文在对股指ETF反转效应和动量效应的指标——累计日内收益(CAR)进行预测时,对研究方法进行了创新,引入了一系列机器学习模型进行预测研究。

3.相关理论概述

3.1交易型开放式指数基金的相关理论

3.1.1交易型开放式指数基金的概念及特点

交易型开放式指数基金(ETF)是一种新型金融产品,其主要是复制特定的指数来构建的。它被允许在证券交易所进行交易,可以对构成指数的证券组合进行申购赎回。投资者通过购买ETF,就可以获得一系列的股票组合。ETF吸纳了封闭式基金与开放式基金的特性,改善了封闭式基金份额不可变和开放式基金无法上市的缺陷,从而在一级市场和二级市场都能进行交易。由于ETF是通过完全复制或抽样复制特定证券指数来构建的,因此其主要目的是准确追踪市场指数。在其管理方面,基金管理人也就采用被动、消极的管理方式。归结汇总,ETF的主要特点如下:

(1)风险分散

ETF作为一种跟踪特定指数的证券投资基金,其投资的标的资产是对应的指数所包含的一揽子证券。因此,投资者可以通过一次买卖ETF来对组合中包含的多种证券进行交易。众所周知,对证券建立投资组合能够有效地分散投资风险。而在构建市场投资组合以分散风险时,投资者付出的成本很高。ETF的出现则可以帮助投资者以较低的成本获得一系列市场投资组合,从而实现风险分散。

(2)交易便利

不同于传统开放式基金,ETF可在二级市场交易。其交易模式与股票十分类似,在ETF上市后,投资者只需要开立一个证券交易账户,就可以对ETF进行买卖交易。此外,相较于其他开放式基金的交易价格要依据当日15:00以后的基金份额净值来确定,交易具有滞后性,而ETF的交易价格可以实时跟踪指数来确定,灵活性较高。因此,相比开放式基金,ETF的流动性更强,当市场波动剧烈时,能够立即实施交易。

5.股指ETF累计日内收益的预测性研究

5.1研究设计

在证实了我国股指ETF存在显著的反转效应和动量效应后,本章将继续探讨能否构建一种较好的模型来对股指ETF的日内反转和动量效应的指标——累计日内收益(CAR)进行预测,从而帮助投资者在交易中获取超额收益。由于以往研究表明机器学习模型对价格预测具有更好的效果,故文章分别构建了传统的线性预测模型和一系列机器学习预测模型(包括线性机器学习模型和非线性机器学习模型),对股指ETF的累计日内收益进行预测。

在预测因子的选择上,研究根据上一章得到的市场开盘收益OR与股指ETF的累计日内收益(CAR)之间存在显著的相关关系这一结论,选取开盘收益OR作为预测因子。此外,由于集合竞价过程能够释放隔夜信息,而股指ETF日内反转和动量效应正是对隔夜信息过度反应的结果,因此事件日的集合竞价信息很可能与后续日内反转和动量效应的预测指标——累计日内收益(CAR)之间具有相关关系。故文章将加入了集合竞价信息(9:25时的收盘价、开盘价、最低价、最高价和成交量)作为预测因子,来对CAR进行预测,从而探究集合竞价信息是否能加强模型对股指ETF的累计日内收益(CAR)的预测能力。

5.2数据预处理

使用数据之前对数据进行处理的过程即数据预处理,其主要包括数据清洗和噪声处理等操作。通常,在进行数据训练前,必须对数据进行预处理,以确保模型的训练精度。本文数据的预处理过程主要涵盖缺失值处理、归一化处理和数据集划分三项。

(1)缺失值处理

在数据处理过程中,所获得的数据偶尔会存在缺失值的情况,这一般是由于机械原因或者人为原因导致的。在机器学习中,特征变量的缺失值越多,对机器学习的预测的干扰就越强。对于缺失值,一般有两种处理方法:一种是直接删除包含缺失值的成行或成列数据,另一种则是对缺失值根据数据情况进行填补。本文经过缺失值检测,发现研究数据中缺失值的数量在总数据量中占比极小,故研究采用第一种处理方法直接删除含有缺失值的行。

(2)归一化处理

每个特征变量数据的量纲不一致,所以如果在预测时直接使用原始的数据值,他们对股指ETF的累计日内收益的影响程度就会不一样。如果各特征间有显著的差别,不但会影响模型的正常训练时间,甚至会导致不收敛。为了将不同特征向量的数值限定在[0,1]上,需要对原始数据进行归一化(标准化)处理。这样不同的特征变量就拥有了一样的尺度,可以有效消除变量间量纲和量纲单位之间差异所造成的影响。

金融论文怎么写

6.结论

6.2不足与展望

虽然本文在探究我国股指ETF市场的反转效应和动量效应上进行了拓展,并采用机器学习方法提高了对于ETF开盘价格异常变动后累计收益的预测能力,但是本文仍存在一些不足之处。

(1)首先是预测因子的选择。证券价格会受到政策信息、利率、汇率、行业状况、市场环境等多种因素影响,而本文仅仅选择了技术指标(开盘收益和集合竞价数据)作为输入变量,在信息阐述方面不够充分。

(2)非线性模型的参数优化。在非线性机器学习模型优化时,受到研究者技术水平的限制,在模型参数调整时,只对主要的参数进行了调整,其余参数则采用默认设置。且对于ANN模型的参数是通过手动调参的方法,多次反复调整各个参数来获取的。因此,本文所得到的预测效果最好的模型仍存在较大的改进空间。

基于本文的研究不足之处,未来的研究者可以沿着上述方面作出更深入的研究。在未来的研究中更加全面地选择预测因子,从而开发更好的预测模型,来提高预测的精度。此外,本文研究发现ANN模型的预测效果最好,由此提出了猜想,股指ETF的输入变量OR和集合竞价信息等高频交易数据可能具有非线性特征。但对此猜想,本文并未展开进行研究,之后的研究可就此展开实证研究。

参考文献(略)

123
限时特价,全文150.00元,获取完整文章,请点击立即购买,付款后系统自动下载

也可输入商品号自助下载

下载

微信支付

查看订单详情

输入商品号下载

1,点击按钮复制下方QQ号!!
2,打开QQ >> 添加好友/群
3,粘贴QQ,完成添加!!