数据预处理
由于部分数据存在不连续性,并且大部分金融数据都具有比较大的噪声。所以需要对数据进行平滑,本文从采用的指数平滑法。对于多个指标单位不一样,采用Z-score的标准化处理,将数据转化为无量纲的纯数值。
采用PCA对数据进行降维
根据经验法,若前K个一般主成分的方差贡献率达到80%以上,则只需要提取前K个。
首先对16个指标矩阵进行bartlett检验,得知p的值很小,并且bartlett值足够大,所以数据适合做主成分分析。
对指标矩阵做主成分分析提取主成分,16个特征根,以及各主成分的方差贡献率和积累方差贡献率如下表。有用前4个主成分的累计方差已经到达80%,说明第前4个主成分的变异基本上反映了全部指标的波动。
则第t个指标对前4个主成分的方差贡献率为:
上一页123下一页全文阅读