干货:一文看懂如何将股票进行分类

相信每一个投资者都明白“不要把鸡蛋放在同一个篮子”的投资道理。股市看似“各自为政”,但实际上,看似完全无关的股票是相关的。那么为了规避风险,将相关性极强的股票加以归类则十分重要。这次为大家分享一些有关量化研究的前提基础:股票的分类。

相关性对股票分类有用吗?

在数学上,最常用的相关性衡量指标有两种方法: Pearson Correlation和Spearman correlation。相信对量化研究稍微了解的球友都不会陌生。皮尔森相关系数(Pearson correlation coefficient)也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数。是用来反映两个变量线性相关程度的统计量。两变量间的相关性可以用许多统计值来测量,最常用的是皮尔森矩相关系数(简称相关系数),其定义为量变量的协方差除以各自的标准差。

利用样本相关系数推断总体中两个变量是否相关,可以用t 统计量对总体相关系数为0的原假设进行检验。若t 检验显著,则拒绝原假设,即两个变量是线性相关的;若t 检验不显著,则不能拒绝原假设,即两个变量不是线性相关的。

spearman相关系数描述的则是变量间的排名相关性。该相关系数用排名而非变量值本身来描述变量信号的大小,可抑制异常值对相关性的影响。其定义为量变量各自排名大小之间的皮尔森相关系数。


然而在实践中,我们发现这种相关性计算的方法却不能够有效反映投资标的间协同变化的联系。因为大量的因素都会影响到相关性,包括公司业务的转变、新增、并购等因素都会增加或者减少相关性;所以这种方法对精确的股票相关性分析不具备实际操作意义。看到这很多球友也许忍不住吐槽——说了这么多就是要告诉我这个已经OUT了?你是在逗我么?别着急,真正的大餐在后面。

相关性在股票中的运用

鱼群在水里游动、鸟群在空中迁徙、蚂群在地上爬行,看其中一只鱼、鸟或者蚂蚁,其轨迹很可能是杂乱无章的,但看群体整体的运动却是有序的。股票市场的行为也类似。两只股票的相关性可能并不稳定,但同时考虑多只股票的相关性,或许就能挖掘出整体的有序特征。这就是基于相关性做股票分类的出发点。不同的股票分类表征着不同的有序特征。

在这里向各位推荐一种基于相关性复杂网络的分类方法。复杂网络是指那些由大规模节点和连边组成且连边在节点中的分布具有复杂性的图。 其发展于图论, 是复杂系统分析的一个实现。 复杂网络的数据分析透过对数据的理解根据分析的目的, 利用数据抽象出系统的对象元素并定义元素的微观关系, 进而由大量的微观关系累积成系统的宏观面貌, 最后再通过宏观面貌来分析整个系统的宏观系统性特征。

由股票的相关性定义股票间的微观关系。从数千只美股的相关性集合中过滤出400只美股股票,这便构成了联系最为紧密的核心美股。复杂网络方法不仅能对数据关系进行可视化分析,而且能在自动化地对股票做分类的同时,为股票的重要性做排名。这样的分类比人工的分类更加精确。

美股整体的网络结构如下图所示。400只核心美股整体大致可以分为4个大类。中间最大的聚类因其相关性的特征又可以进一步分解为3个紧密联系的大板块(图中不同的颜色代表不同的板块)。


通过对各个板块的研究发现,这六个板块概括起来分别是:大盘股板块(红色)、ETF板块(蓝色)、金融业板块(嫩绿色)、公共事业板块(橙色)、能源板块(粉色)、房地产板块(墨绿色)。细心的球友或许能够看到,中间大团的左上方有个白色的小团,那其实是军工板块。其中字号的大小表示股票的重要性,连边的粗细代表相关性的紧密程度。

金融业是股票市场动力源泉,因此跟大盘、核心ETF结合得很紧密,符合直觉。另外,我们还可以看到,能源、房产、公共事业这三个板块在美股中占据了重要的地位,两两相关性不强,与大盘相关性也不强。以上特点从相关性的层面上就构成了美股市场的板块结构。从分散投资、降低风险的目的上考虑,应尽量避免把所有股票投在同一个板块里。

这些选股小技巧,你get到了吗?

免责声明:信息仅供参考,不构成投资及交易建议。投资者据此操作,风险自担。
如果觉得文章对你有用,请随意赞赏收藏
相关推荐
相关下载
登录后评论
Copyright © 2019 宽客在线