股票对数收益率与时间序列分析
Ⅰ 如何用stata求股指的对数收益率
gen id=_n
tsset id
gen r=d.lnp
Ⅱ 2020-03-28 线性时间序列模型
课程采用Ruey S. Tsay的《金融数据分析导论:基于R语言》(Tsay 2013 ) (An Introction to Analysis of Financial Data with R)作为主要教材之一。
时间序列的线性模型,包括:
股价序列呈现缓慢的、非单调的上升趋势, 局部又有短暂的波动。
可口可乐公司每季度发布的每股盈利数据。 读入:
时间序列图:
序列仍体现出缓慢的、非单调的上升趋势,又有明显的每年的周期变化(称为季节性), 还有短期的波动。
下面用基本R的 plot() 作图并用不同颜色标出不同季节。
现在可以看出,每年一般冬季和春季最低, 夏季最高,秋季介于夏季和冬季之间。
收益率在0上下波动,除了个别时候基本在某个波动范围之内。
用xts包的 plot() 函数作图:
聚焦到2004年的数据:
红色是6月期国债利率, 黑色是3月期国债。 一般6月期高, 但是有些时期3月期超过了6月期,如1980年:
如图标普500月收益率那样的收益率数据基本呈现出在一个水平线(一般是0)上下波动, 且波动范围基本不变。 这样的表现是时间序列“弱平稳序列”的表现。
弱平稳需要一阶矩和二阶矩有限。某些分布是没有有限的二阶矩的,比如柯西分布, 这样的分布就不适用传统的线性时间序列理论。
稍后给出弱平稳的理论定义。
如图2可口可乐季度盈利这样的价格序列则呈现出水平的上下起伏, 如果分成几段平均的话, 各段的平均值差距较大。 这体现出非平稳的特性。
以下为一堆公式推导,具体查看: http://www.math.pku.e.cn/teachers/lidf/course/fts/ftsnotes/html/_ftsnotes/fts-tslin.html#fig:tslin-intro-sp02
时间序列
自协方差函数
弱平稳序列
图6 是IBM股票月度简单收益率对标普500收益率的散点图。 从图中看出, 两者有明显的正向相关关系。
对于不独立的样本, 比如时间序列样本, 也可以计算相关系数, 其估计合理性需要一些模型假设。
对于联合分布非正态的情况, 有时相关系数不能很好地反映X和Y的正向或者负向的相关。 斯皮尔曼(Spearman)相关系数是计算X的样本的秩(名次)与Y的样本的秩之间的相关系数, 也称为Spearman rank correlation。
另一种常用的非参数相关系数是肯德尔tau(Kendall’s )系数, 反映了一致数对和非一致数对之间的差别。
即两个观测的分量次序一致的概率减去分量次序相反的概率。 一致的概率越大,说明两个的正向相关性越强。
对IBM收益率与标普收益率数据计算这三种相关系数:
自相关函数 (Autocorrelation function, ACF)参见 (何书元 2003 ) P.131 §4.2的例2.1。 原始文献: MAURICE STEVENSON BARTLETT, On the Theoretical Specification and Sampling Properties of Auto-Correlated Time Series, Journal of the Royal Statistical Society (Supplement) 8 (1946), pp. 24-41.
在基本R软件中, acf(x) 可以估计时间序列 x 的自相关函数并对其前面若干项画图。
例:CRSP的第10分位组合的月对数收益率, 1967-1到2009-12。 第10分位组合是NYSE、AMEX、NASDAQ市值最小的10%股票组成的投资组合, 每年都重新调整。
图6: CRSP第10分位组合月对数收益率
用 acf() 作时间序列的自相关函数图:
acf() 的返回值是一个列表,其中 lag 相当于, acf 相当于。 用 plot=FALSE 取消默认的图形输出。
有研究者认为小市值股票倾向于在每年的一月份有正的收益率。
为此,用对的检验来验证。 如果一月份有取正值的倾向, 则相隔12个月的值会有正相关。
计算统计量的值,检验p值:
值小于0.05, 这个检验的结果支持一月份效应的存在性。
Ljung和Box(Ljung and Box 1978 )对Box和Pierce(Box and Pierce 1970 )提出了混成统计量(Portmanteau statistic)
检验方法进行了改进
在R软件中, Box.test(x, type="Ljung-Box") 执行Ljung-Box白噪声检验。 Box.test(x, type="Box-Pierce") 执行Box-Pierce混成检验。 用 fitdf= 指定要减去的自由度个数。
检验IBM股票月收益率是否白噪声。
考虑IBM股票从1926-01到2011-09的月度收益率数据, 简单收益率和对数收益率分别考虑。
读入数据:
读入的是简单收益率的月度数据。 作ACF图:
从ACF来看月度简单收益率是白噪声。
作Ljung-Box白噪声检验, 分别取和:
在0.05水平下均不拒绝零假设, 支持IBM月度简单收益率是白噪声的零假设。
从简单收益率计算对数收益率, 并进行LB白噪声检验:
在0.05水平下不拒绝零假设。
Box-Pierce检验和Ljung-Box检验受到取值的影响, 建议采用, 且序列为季度、月度这样的周期序列时, 应取为周期的整数倍。
对CRSP最低10分位的资产组合的月简单收益率作白噪声检验。
此组合的收益率序列的ACF:
针对和作Ljung-Box白噪声检验:
在0.05水平下均拒绝零假设, 认为CRSP最低10分位的投资组合的月度简单收益率不是白噪声。
有效市场假设认为收益率是不可预测的, 也就不会有非零的自相关。 但是,股价的决定方式和指数收益率的计算方式等可能会导致在观测到的收益率序列中有自相关性。 高频金融数据中很常见自相关性。
常见的白噪声检验还有TREVOR S. BREUSCH (1978) 和LESLIE G. GODFREY (1978)提出的拉格朗日乘子法检验(LM检验)。 零假设为白噪声, 对立假设为AR、MA或者ARMA。 参见:
设是独立同分布的二阶矩有限的随机变量, 称为独立同分布白噪声(white noise)。 最常用的白噪声一般假设均值为零。 如果独立同分布, 称为高斯(Gaussian)白噪声或正态白噪声。
白噪声序列的自相关函数为零(除外)。
实际应用中如果样本自相关函数近似为零 (ACF图中都位于控制线之内或基本不超出控制线), 则可认为该序列是白噪声的样本。
如:IBM月度收益率可以认为是白噪声(见例 3.3 ); CRSP最低10分位投资组合月度收益率不是白噪声(见例 3.4 )。
不是所有的弱平稳时间序列都有这样的性质。 非平稳序列更是不需要满足这些性质。
公式就不赘述
如果从时间序列的一条轨道就可以推断出它的所有有限维分布, 就称其为严平稳遍历的。 这里不给出遍历性的严格定义, 仅给出一些严平稳遍历的充分条件。 可以证明, 宽平稳的正态时间序列是严平稳遍历的, 由零均值独立同分布白噪声产生的线性序列是严平稳遍历的。
Tsay, Ruey S. 2013. 金融数据分析导论:基于R语言 . 机械工业出版社.
何书元. 2003. 应用时间序列分析 . 北京大学出版社.
Box, GEP, and D. Pierce. 1970. “Distribution of Resial Autocorelations in Autoregressive-Integrated Moving Average Time Series Models.” J. of American Stat. Assoc. 65: 1509–26.
Ljung, G., and GEP Box. 1978. “On a Measure of Lack of Fit in Time Series Models.” Biometrika 66: 67–72.
参考学习资料: http://www.math.pku.e.cn/teachers/lidf/course/fts/ftsnotes/html/_ftsnotes/fts-tslin.html#fig:tslin-intro-sp02
Ⅲ 金融时间序列分析用R语言画简单收益率和对数收益率的ACF图!
acf(int[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
log return')
Box.test(int[,2], lag = 5, type = "Ljung-Box")
Box.test(int[,2], lag = 10, type = "Ljung-Box")
Box.test(int.l[,2], lag = 5, type = "Ljung-Box")
Box.test(int.l[,2], lag = 10, type = "Ljung-Box")
运行结果有以下错误,怎么办?
> int <- read.table("d-intc7208.txt", head=T)
错误于file(file, "rt") : 无法打开链结
此外: 警告信息:
In file(file, "rt") :
无法打开文件'd-intc7208.txt': No such file or directory
+ acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int monthly
错误: 意外的符号 in:
"
acf(int.l[,2], lag.max = 15,type = "correlation", plot = TRUE,main='int"
> log return')
错误: 意外的符号 in "log return"
Ⅳ 有一组股价的数据,想用eviews来处理收益率,求问怎么弄啊~~~老师要求使用对数求收益率
收益率定为R,股价定为P,收益率为R=lnP(t)-lnP(t-1)
Ⅳ 股票收益率为什么要用对数收益率,请问各
在命令窗口中输入 genr dr=log(r) 其中,log()为自然对数,r为指数收益率,dr为对数转换后的新变量
Ⅵ "由一个具有常数有限无条件均值和方差的平稳随机过程产生的"
(1)式给出的均值方程是一个带有误差项的外生变量的函数。由于是以前面信息为基础的一期向前预测方差,所以称为条件均值方程。
(2)式给出的方程中: 为常数项, (ARCH项)为用均值方程的残差平方的滞后项, (GARCH项)为上一期的预测方差。此方程又称条件方差方程,说明时间序列条件方差的变化特征。
通过以下六步进行求解:
本文选取哈飞股份2009年全年的股票日收盘价,采用Eviews 6.0的GARCH工具预测股票收益率波动率。具体计算过程如下:
第一步:计算日对数收益率并对样本的日收益率进行基本统计分析,结果如图1和图2。
日收益率采用JP摩根集团的对数收益率概念,计算如下:
其中Si,Si-1分别为第i日和第i-1日股票收盘价。
图1 日收益率的JB统计图
对图1日收益率的JB统计图进行分析可知:
(1)标准正态分布的K值为3,而该股票的收益率曲线表现出微量峰度(Kurtosis=3.gt;3),分布的凸起程度大于正态分布,说明存在着较为明显的“尖峰厚尾”形态;
(2)偏度值与0有一定的差别,序列分布有长的左拖尾,拒绝均值为零的原假设,不属于正态分布的特征;
(3)该股票的收益率的JB统计量大于5%的显著性水平上的临界值5.99,所以可以拒绝其收益分布正态的假设,并初步认定其收益分布呈现“厚尾”特征。
以上分析证明,该股票收益率呈现出非正态的“尖峰厚尾”分布特征,因此利用GARCH模型来对波动率进行拟合具有合理性。
第二步:检验收益序列平稳性
在进行时间序列分析之前,必须先确定其平稳性。从图2日收益序列的路径图来看,有比较明显的大的波动,可以大致判断该序列是一个非平稳时间序列。这还需要严格的统计检验方法来验证,目前流行也是最为普遍应用的检验方法是单位根检验,鉴于ADF有更好的性能,故本文采用ADF方法检验序列的平稳性。
从表1可以看出,检验t统计量的绝对值均大于1%、5%和10%标准下的临界值的绝对值,因此,序列在1%的显著水平下拒绝原假设,不存在单位根,是平稳序列,所以利用GARCH(1,1)模型进行检验是有效的。
图2 日收益序列图
表1ADF单位根检验结果
第三步:检验收益序列相关性
收益序列的自相关函数ACF和偏自相关函数PACF以及Ljung-Box-Pierce Q检验的结果如表3(滞后阶数 =15)。从表4.3可以看出,在大部分时滞上,日收益率序列的自相关函数和偏自相关函数值都很小,均小于0.1,表明收益率序列并不具有自相关性,因此,不需要引入自相关性的描述部分。Ljung-Box-Pierce Q检验的结果也说明日收益率序列不存在明显的序列相关性。
表2自相关检验结果
第四步:建立波动性模型
由于哈飞股份收益率序列为平稳序列,且不存在自相关,根据以上结论,建立如下日收益率方程:
(3)
(4)
第五步:对收益率残差进行ARCH检验
平稳序列的条件方差可能是常数值,此时就不必建立GARCH模型。故在建模前应对收益率的残差序列εt进行ARCH检验,考察其是否存在条件异方差,收益序列残差ARCH检验结果如表3。可以发现,在滞后10阶时,ARCH检验的伴随概率小于显著性水平0.05,拒绝原假设,残差序列存在条件异方差。在条件异方差的理论中,滞后项太多的情况下,适宜采用GARCH(1,1)模型替代ARCH模型,这也说明了使用GARCH(1,1)模型的合理性。
表3日收益率残差ARCH检验结果
第六步:估计GARCH模型参数,并检验
建立GARCH(1,1)模型,并得到参数估计和检验结果如表4。其中,RESID(-1)^2表示GARCH模型中的参数α,GARCH(-1)表示GARCH模型中的参数β,根据约束条件α+βlt;1,有RESID(-1)^2+GARCH(-1)=0.95083<1,满足约束条件。同时模型中的AIC和SC值比较小,可以认为该模型较好地拟合了数据。