您的位置 首页 Defi-NFT

巴比特首发|对比特币市值占比的预测及相关解读和建议

中文首发巴比特,本文系Chain Hill Capital原创,未经授权禁止转载。

英文原文链接:https://mirror.xyz/0x3777ddf5a602Fe27B646774125DcbB98Fb83be82/lJo7M4-FM39kKJtQvPUdZsuWlbnwHUxA_ZIuH7579gQ

注:本文所有模型以及结果均基于2021年11月1日前的数据。

作者:Yetong;第二作者:Carrie

本文通过构建显著性检测和时间序列模型研究比特币市值占比的相关特征,并基于模型结果给出相关解读及建议。

TL;DR

1. 下半年的比特币市值占比显著高于上半年,而以太坊市值占比呈相反趋势 & 季节性特征

显著性检测结果显示下半年的比特币市值占比显著高于上半年,而以太坊上半年的市值占比显著高于下半年,存在明显板块轮动。可能原因为在市场上升周期中(尤其是比特币上涨之后),资金追逐更高的回报率。同时,基于时间序列模型,我们发现了显著的月份季节特征,即去年同一月份的比特币市值占比与今年同一月份的比特币市值占比显著相关。根据以上规律调整投资组合或可更好的适应市场。

2. 比特币市值占比存在长期下降趋势

基于比特币市值占比的长期下降趋势,以及比特币发展较为成熟,比特币的长期回报预期相对较小,其他更早期阶段的项目可能有更高的回报潜力。

3. 当比特币市值占比呈下降趋势时,我们的模型预测误差较小;当比特币市值占比呈上升趋势时,预测误差较大

根据不同时间段的预测模型进行评估,发现后续有下降趋势的75百分位误差都小于后续有上升趋势的75百分位误差。可能原因是所有构建的时间序列模型都捕捉到了比特币市值占比的长期下降趋势,所以当比特币市值占比呈下降趋势时,预测较为准确。所以使用本文模型进行预测时,当比特币市值占比为下降趋势时,预测较为准确;当近期比特币市值占比大幅偏离预测值时,投资者需结合更多市场信息做好风控。

一. 背景介绍

如下图(来源:coinmarketcap),自2013年至2021年11月,加密货币总市值从10多亿美元增长到现如今的2万多亿美元。同时加密市场内的项目数量也发展到了数万级别,其中,比特币占据市场的主导地位。作为一种价值存储、风险规避的资产,比特币目前和全球主流货币并驾齐驱。

随着加密市场的发展,应用范围的扩大,越来越多的潜力项目逐渐展现。因此,从逻辑来讲,比特币市值占比(BTCD)随着整个行业的发展不断下降似乎不可避免。选取2013年至今的BTCD数据绘图,可以初步看出,BTCD长期呈下降趋势。

选取2016年后的数据,绘制比特币、以太坊以及Altcoins(本文定义为比特币和以太坊以外的加密货币总体)月平均市值占比变化的热图。可以看出BTCD在下半年的增量大于在上半年的增量,而以太坊市值占比(ETHD)和Altcoins市值占比(ALTD)呈相反趋势。依此我们提出假设:BTCD存在一定的季节性特征。

注:本文所有模型以及结果均基于2021年11月1日前的数据。

二. 显著性检测

为证明上述所说“BTCD在下半年的增量大于在上半年的增量,而ETHD和ALTD呈相反趋势”,我们需构建显著性检测。在构建显著性检测前,我们需要确认数据是否属于正态分布,如果数据为正态分布,我们则进行参数检验;如果数据不为正太分布,则需要进行非参数检验。

选取2016年后BTCD、ETHD和ALTD,计算出月平均市值占比变化并检验数据是否服从正态分布。从下方结果图可看出三列数据的Pr < W 都小于0.01,所以我们拒绝原假设(原假设为正态分布)。

在进行非参数检测前,使用Box-Cox方法,看能否将非正态分布的数据转化为正态分布数据。下方结果图依次为月平均BTCD、ETHD和ALTD经过Box-Cox转换后的正态分布检测结果图,可发现三列数据的Pr < W 都大于0.01,意味着我们接受原假设,则经转换后的三列数据均为正态分布,所以我们选取参数显著性检验。

这里我们的单边检验假设为:

月平均BTCD检测结果:

第一张结果图为基本统计量;第二张结果图为方差齐性结果图;第三张为T检验结果。首先第二张图的P值>0.05,说明方差相齐,再看第三张图的“Equal”部分的P值<0.05,拒绝原假设。证明下半年月平均BTCD显著高于上半年。

月平均ETHD检测结果:

与月平均BTCD结果图相仿,第三张图的“Equal”部分的P值<0.0001,则拒绝原假设,证明上半年月平均ETHD显著高于下半年。

月平均ALTD检测结果:

从月平均ALTD结果图来看,“Equal”部分的P值>0.05,则不能拒绝原假设,说明上半年的月平均ALTD与下半年的月平均ALTD并无显著差异。

三. 时间序列模型—月数据

趋势拟合

在确定了下半年月平均BTCD显著高于上半年后,我们使用BTCD所有的历史数据建立时间序列模型并研究BTCD的季节性特征;同时采取趋势拟合法对BTCD进行长期趋势预测,也就是将时间做为自变量,BTCD序列值作为因变量,建立序列值随时间变化的回归模型。

从下图回归结果图可看出,BTCD相对时间的系数显著为负(P值 < 0.0001),所以确定BTCD有长期下降趋势。

ARIMA模型

1. 平稳性和白噪声

观测BTCD序列的时序图,可知序列具有线性长期下降趋势。以及单位根检测(检测平稳性)的Pr的值均大于0.05(不显著),所以我们接受原假设非平稳性。同时根据白噪声检测的Pr均小于0.001(显著),所以我们拒绝原假设数据是白噪声。所以原比特币市值占比的数据是非平稳非白噪声数据。因此,我们对数据进行差分,直到数据平稳。

2. 一阶差分

将数据进行一阶差分后,我们得到平稳非白噪声数据,因此,我们可以建立有效模型。

3. AMRA (p, q)

通过SAS的SCAN算法,我们选择p=2,q=0进行模型建立。

4. 模型修正

通过ARIMA (2, 1, 0)的模型建立,我们得出以上结果图。在0.1的显著水平下,可以看出所有的AR系数都显著,以及残差为白噪声,说明建立的模型信息提取充分,因此ARIMA (2, 1, 0)模型合格。模型如下:

5. 模型预测

通过以上ARIMA (2, 1, 0)模型,我们预测在24个月后,比特币市值占比为32.7914%

通过模型的残差,我们计算出模型的修正R square为95.7%,也就是说该回归模型可以解释比特币市值占比95.7%的变异。

季节ARIMA模型

时间序列的特征可以拆分为三个部分:趋势特征、周期特征和随机特征。为了研究BTCD的周期特征,这里特指季节特征,我们采用乘法季节模型。(周期性不等同于季节性,季节性特征的时间间隔一致,而周期特征时间间隔不一定一致)

1. 原数据进行一阶十二步差分(相邻12期的数据相减)

我们知道原始的BTCD数据为非平稳非白噪声数据,为了探究数据是否具有月的季节特征,我们需将原数据进行一阶十二步差分。

经过十二步差分后,得到平稳非白噪声数据,因此,我们可以建立有效模型。

2. 模型定阶

由于序列的季节效应、长期趋势效应和随机波动间存在复杂的交互影响关系,因此我们采用乘法季节模型。乘法模型的构造原理为:1)用低阶模型ARMA (p, q)获取短期相关性;2)用周期步长为单位的ARIMA (P, Q)S提取季节相关性;3)拟合1)和2)模型。

通过观察一阶十二步差分后的自相关系数(ACF)和偏自相关系数(PACF)的特征,可以看出ACF在12阶内截尾,PACF在12阶内拖尾(有数据大于两倍标准差),所以使用ARMA (0, 1)获取短期相关性。通过观察12阶、24阶(以周期步长12为单位)的ACF和PACF,可以发现12阶的ACF和PACF显著,24阶的PACF显著,所以以季节为特征的ACF截尾,PACF拖尾。所以使用ARMA (0, 1)12模型来获取季节相关性信息。最终拟合的乘法季节模型为ARIMA (0, 1, 1) * ARIMA (0, 1, 1)12。

同时根据12阶的ACF和PACF显著,24阶的PACF显著,我们可以得出这样的结论:去年同一月份的BTCD很大程度上会影响今年同一月份的BTCD,证明BTCD季节性特征的存在。

3. 模型修正

通过ARIMA (0, 1, 1) * ARIMA (0, 1, 1)12的模型建立,我们得出以上结果。可以看出所有的系数都显著,以及残差为白噪声,说明建立的模型信息提取充分,因此ARIMA (0, 1, 1) * ARIMA (0, 1, 1)12模型合格。模型如下:

4. 模型预测

通过以上ARIMA (0, 1, 1) * ARIMA (0, 1, 1)12模型,我们预测在24个月后,比特币市值占比为31.6735%

通过模型的残差,我们计算出模型的修正R square为94.3947%,也就是说该回归模型可以解释比特币市值占比约95%的变异。

四. 时间序列模型—周数据

在上一节,我们使用月平均市值占比进行研究,为了缩短预测间隔,这一节我们将使用周平均市值占比作为研究对象。

ARIMA模型

1. 平稳性和白噪声

对BTCD周数据进行单位根检测和白噪声检测,观测到Pr的值均大于0.05(不显著,接受原假设非平稳性),以及Pr均小于0.001(显著,拒绝原假设白噪声)。所以BTCD周数据仍是非平稳非白噪声数据。

2. 一阶差分

将数据进行一阶差分后,我们得到平稳非白噪声数据,因此,我们可以建立有效模型。

3. AMRA (p, q)

通过SAS的SCAN算法,我们选择p=1,q=0进行模型建立。

4. 模型修正

通过ARIMA (1, 1, 0)的模型建立,我们得出以上结果图。可以看出AR系数显著,以及残差为白噪声,说明建立的模型信息提取充分,因此ARIMA (1, 1, 0)模型合格。模型如下:

5. 模型预测

通过以上ARIMA (1, 1, 0)模型,我们预测在4周后,比特币市值占比为45.1261%;预测在104个周(约24个月)后,比特币市值占比为34.2524%,略高于月数据模型所预测的值(32.7914%)。

通过模型的残差,我们计算出模型的修正R square为97.03%,也就是说该回归模型可以解释比特币市值占比约97%的变异。

季节ARIMA模型

1. 原数据进行一阶四步差分(相邻四期的数据相减)

我们知道BTCD周数据为非平稳非白噪声数据,为了探究数据是否具有季节特征,我们将数据进行一阶四步差分。

经过一阶四步差分后,得到平稳非白噪声数据,因此,我们可以建立有效模型。

2. 模型定阶

我们继续选用乘法季节模型,构造原理为:1)用低阶模型ARMA (p, q)获取短期相关性;2)用周期步长为单位的ARIMA (P, Q)S提取季节相关性;3)拟合1)和2)模型。​ 

通过观察一阶四步差分后ACF和PACF的特征,选择拟合的模型为ARIMA (0, 1, 1) * ARIMA (0, 1, 1)4。同时根据4阶的ACF和PACF显著,8、12阶的PACF显著,我们可以得出这样的结论:四周前的BTCD很大程度上会影响现在的BTCD,证明BTCD季节性特征的存在。

3. 模型修正

通过ARIMA (0, 1, 1) * ARIMA (0, 1, 1)4模型建立,我们得出以上结果。可以看出所有的系数都显著,以及残差为白噪声,说明建立的模型信息提取充分,因此ARIMA (0, 1, 1) * ARIMA (0, 1, 1)4模型合格。模型如下:

4. 模型预测

通过以上ARIMA (0, 1, 1) * ARIMA (0, 1, 1)4模型,我们预测在4周后,比特币市值占比为45.4403%;预测在104个周(约24个月)后,比特币市值占比为38.3482%,高于月数据季节模型所预测的值(31.6735%)。

通过模型的残差,我们计算出模型的修正R square为85.7922%,也就是说该回归模型可以解释比特币市值占比约86%的变异。对比ARIMA (1, 1, 0)模型,该模型的R square降低,可能原因为:四周并不是严格意义上的一个月,从ACF和PACF图也可看出,ACF的4阶和5阶都显著,PACF的4阶、5阶、8阶、9阶、10阶都显著。

五. 模型预测对比

为了预估模型的准确度以及最低可准确预测多长时间的BTCD,我们使用不同时间段的数据构建模型,这里使用周数据。

1. 2013/04—2018/12

与构建上述ARIMA模型一样,首先将原数据差分,进行模型定阶。定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、20周后的BTCD分别为51.8077%(真实数据为52.7309%)、50.9666%(真实数据为52.0026%)、49.5602%(真实数据为58.1098%)。

2. 2013/04—2019/03

定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、20周后的BTCD分别为50.1506%(真实数据为54.4983%)、49.3105%(真实数据为55.7968%)、47.9095%(真实数据为68.1467%)。

3. 2013/04—2019/06

定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、20周后的BTCD分别为60.7912%(真实数据为65.4735%)、60.1716%(真实数据为70.2934%)、59.1505%(真实数据为65.3576%)。

4. 2013/04—2019/09

定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、20周后的BTCD分别为66.5799%(真实数据为67.1689%)、66.0919%(真实数据为65.8393%)、65.2822%(真实数据为62.8051%)。

5. 2013/04—2019/12

定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、20周后的BTCD分别为68.0411%(真实数据为65.7814%)、67.5962%(真实数据为63.2734%)、66.8553%(真实数据为68.5355%)。

6. 2013/04—2020/03

定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、20周后的BTCD分别为66.3810%(真实数据为66.3168%)、65.9247%(真实数据为64.9024%)、65.1669%(真实数据为59.8290%)。

7. 2013/04—2020/06

定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、20周后的BTCD分别为64.8677%(真实数据为64.0777%)、64.4042%(真实数据为57.4548%)、63.6325%(真实数据为68.9859%)。

8. 2013/04—2020/09

定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、20周后的BTCD分别为60.0899%(真实数据为64.8300%)、59.5703%(真实数据为62.8073%)、58.7028%(真实数据为63.6897%)。

9. 2013/04—2020/12

定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、20周后的BTCD分别为70.9716%(真实数据为64.4643%)、70.6244%(真实数据为62.5588%)、70.0521%(真实数据为41.2876%)。

10. 2013/04—2021/03

定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、20周后的BTCD分别为59.9858%(真实数据为50.9226%)、59.4978%(真实数据为44.1656%)、58.6835%(真实数据为45.6051%)。

11. 2013/04—2021/06

定阶后的模型为ARIMA (1, 1, 0),并验证了建立的模型信息提取充分以及系数显著。预测4周、10周、18周后的BTCD分别为47.2849%(真实数据为50.6103%)、46.6364%(真实数据为42.1630%)、45.7702%(真实数据为45.58%)。

通过选取不同时间段的BTCD进行建模,得到预测值,并计算绝对误差(真实值减去预测值的绝对值),以及分别计算出所有时间段1周-4周、5周-10周以及11周-20周的绝对误差的75百分位数(意味75%的数值小于或等于此数),并绘制下方结果表格。预测1-4周的75百分位数的绝对误差为3.4808%、5-10周的绝对误差7.7291%、11-20周的绝对误差10.5359%。

通过绘制结果表格的热图,发现,当4周内绝对误差较小时,相应20周内的误差都会较小,似乎有规律可寻。

观测上方BTCD的历史图,可以发现,当BTCD呈下降趋势时,预测误差较小;当BTCD呈上升趋势时,预测误差较大。例如使用到2018年12月前、2019年9月前、2020年3月前的数据进行预测后续BTCD的走势,发现预测误差都比较小,而真实的BTCD在这些日期后都呈下降趋势;相反,如使用到2019年3月前、2020年9月前的数据进行预测后续BTCD的走势,发现预测误差都比较大,真实的BTCD在这些日期后也呈上升趋势。

将时间段分为BTCD后续下降和后续上升,得出上方结果表。可以看出后续有下降趋势的75百分位误差都小于后续有上升趋势的75百分位误差。可能原因为所有构建的时间序列模型都捕捉到了BTCD的长期下降趋势,所以BTCD有下降趋势时,预测较为准确。

在这一节,我们得出以下观点:1)短期预测结果较好,4周的75百分位数的平均绝对误差为3.4808%;2)当BTCD呈下降趋势时,预测误差较小;当BTCD呈上升趋势时,预测误差较大。

六. 模型缺陷

基于历史BTCD周、月数据构建的时间序列模型展现了BTCD的下降趋势和季节性特征,但是该模型只能用来预测短期的BTCD走势。如用基于月数据的季节ARIMA模型来预测长期的BTCD的趋势,在90个月后,BTCD将变为负值;如用基于周数据的ARIMA模型来预测长期的BTCD的趋势,在420个周后,BTCD将变为负值,这时预测的BTCD无意义。目前,越来越多投资者将比特币被作为一种避险资产和价值储存,同时伴随着以太坊生态的快速发展,BTCD预测会长期呈现下降趋势,但下降速度则会与现在不同。

七. 结语

从历史的BTCD数据可以观测出下降趋势和季节性特征。为了验证BTCD的特征,我们通过显著性检测和时间序列模型,可以确定:1)下半年BTCD显著高于上半年BTCD,而ETHD呈相反趋势;2)BTCD的下降趋势;3)BTCD的季节性特征;4)时间序列模型只能进行短期的BTCD的预测,以及短期预测结果较好,1-4周绝对误差的75百分位数为3.4808%;5)当BTCD呈下降趋势时,预测误差较小;当BTCD呈上升趋势时,预测误差较大。

热门文章

发表评论

您的电子邮箱地址不会被公开。