geektyper-win8 u盘

聚类分析案例
2023年4月6日发(作者:regsvr32)

喀什大学实验报告

《多元统计分析SPSS》

实验报告

实验课程:基于SPSS的数据分析

实验地点:现代商贸实训中心实验室名称:经济统计实验室

学院:xxx学院年级专业班:xxx班

学生姓名:xxx学号:2

完成时间:2016年x月x日

开课时间:2016至2017学年第1学期

成绩

教师签名

批阅日期

实验项目:中国上市银行竞争力分析

(一)实验目的

本实验目的围绕上市商业银行竞争力这一主线,遵循一般理论、具体分析到

对策建议的研究思路,以我国国内上市的十家商业银行为研究对象,采用其2012

年度财务报告的数据,从盈利能力、安全能力和发展能力三方面共选取了8个重

要指标,试图通过这些指标量化影响竞争力的因素,构建我国上市商业银行的竞

争力评价指标体系,并运用因子分析方法,对我国上市商业银行的竞争力状况进

行了分析评价。最后针对分析的结果,通过对我国上市银行竞争力进行优劣势比

较,提出了提升我国上市商业银行竞争力的一些建议。

(二)实验资料

通过对资产利润率、不良贷款率、资产负债率、资本充足率、每股收益增长

率、贷款增长率、存款增长率、总资产增长率等指标的选择分析不同指标在进行

因子分析时所考虑的因素是否存在差异,影响我国上市商业银行的竞争力状况的

因素与上述指标是否有关。

具体数据如下所示:

十家同类型上市商业银行2012年指标

盈利能力安全能力发展能力

资产利润

不良贷款率

资产负债

资本充足

每股收益

增长率

贷款增长

存款增长

总资产增

长率

平安银行1.09%0.95%94.72%11.37%6.07%16.13%20.01%27.69%

浦发银行1.42%0.58%94.29%12.45%25.55%16.01%15.31%17.17%

建设银行1.80%0.99%93.20%14.32%13.24%15.64%13.57%13.77%

中国银行1.48%0.95%93.21%13.63%12.19%8.23%4.04%7.19%

农业银行1.42%1.33%94.33%12.61%18.42%14.10%12.90%13.40%

工商银行1.76%0.85%93.77%13.66%13.30%13.00%10.00%10%

交通银行1.43%0.92%92.77%14.07%7.31%15.05%13.56%14.36%

招商银行1.75%0.61%94.12%12.14%25.75%16.05%14.07%21.94%

中信银行1.41%0.74%93.14%13.44%-7.04%15.96%14.59%7.02%

民生银行1.58%0.76%94.58%10.75%27.62%3.53%2.76%8.44%

(三)实验步骤

1、选择菜单

2、选择参与因子分析的变量到(变量V)框中

3、选择因子分析的样本

4、在所示窗口中点击(描述D)按钮,指定输出结果,输出基本统计量、图

形等

5、在所示窗口中点击(抽取E)按钮指定提取因子的方法为:主成分分析法

6、在所示的窗口中点击(旋转T)按钮选择因子旋转方法

7、在所示窗口中点击(得分S)按钮选择计算因子得分的方法

8、在所示窗口中点击(选项)按钮

(四)实验结果及分析

分析结果如下表所示。

通过观察原始变量的相关系数矩阵,可以看到,矩阵中存在许多比较高的相

关系数,并且大多数变量通过了原假设为相应变量之间的相关系数为0的t假设。

相关系数实际上反映的是公共因子起作用的空间,相关系数越大,表明数据适合

做因子分析。

KMO和巴特利特检验

KMO取样适切性量数。.518

巴特利特球形度检验近似卡方50.188

自由度28

显著性.006

同时,KMO级Bartlett检验是否适合做因子分析。以上是KMO级Bartlett

检验结果,由表可知:KMO值为0.518,说明该数据适合做因子分析。上表中的

巴特利特球体检验的X统计值的显著性概率是O.000,小于1%,因此拒绝原假

设,说明数据具有相关性,适宜做因子分析。

反映像矩阵

相关性矩阵

每股收益增长率贷款增长率存款增长率总资产增长率

相关性资产利润率.383-.144-.404-.359

不良贷款率-.207-.025-.009-.086

资产负债率.563-.166.105.494

资本充足率-.479.357.044-.392

每股收益增长率1.000-.366-.345.159

贷款增长率-.3661.000.922.551

存款增长率-.345.9221.000.738

总资产增长率.159.551.7381.000

显著性(单尾)资产利润率.137.346.124.154

不良贷款率.283.472.490.407

资产负债率.045.323.386.073

资本充足率.081.155.452.131

每股收益增长率.149.164.330

贷款增长率.149.000.049

存款增长率.164.000.007

总资产增长率.330.049.007

每股收益增长率贷款增长率存款增长率总资产增长率

反映像协方差矩阵资产利润率-.075-.025.025-.005

不良贷款率.038.031-.012-.031

资产负债率-.064-.001-.007.027

资本充足率-.002-.021.011.015

每股收益增长率.207-.026.034-.107

贷款增长率-.026.025-.021.018

存款增长率.034-.021.020-.032

总资产增长率-.107.018-.032.175

反映像相关性矩阵资产利润率-.277-.273.306-.019

不良贷款率.113.266-.114-.101

资产负债率-.464-.031-.158.214

资本充足率-.018-.524.307.146

每股收益增长率.496a-.358.533-.560

贷款增长率-.358.496a-.932.269

存款增长率.533-.932.503a-.542

总资产增长率-.560.269-.542.651a

a.取样适切性量数(MSA)

反映像矩阵在其对角线上的数字若大于0.05(出口合同为0.406)则适合因子分

析,小于0.05则不适合因子分析。从表中得知,适合做因子分析。

公因子方差

初始提取

资产利润率1.000.818

不良贷款率1.000.519

资产负债率1.000.912

资本充足率1.000.928

每股收益增长率1.000.786

贷款增长率1.000.953

存款增长率1.000.979

总资产增长率1.000.865

提取方法:主成分分析法。

变量共同度,它刻划了全部公共因子对各个变量的总方差所作的贡献,也称

为公因子方差,从上表中可以得到变量共同度大部分都接近1,说明该变量的几

乎全部原始信息都被所选取的公共因子说明了,也就是说,由原始变量空间转为

因子空间转化的性质较好,保留原来信息量多,因此,

2h

i是i

X

方差的重要组

成部分。

检验可以做因子分析后,我们通过因子分析得到相应的特征值和对应因子的

贡献率,如下表所示

成分

初始特征值提取载荷平方和旋转载荷平方和

总计

方差百分

比累积%总计

方差百分

比累积%总计

方差

的%累积%

12.80034.99834.9982.80034.99834.9982.66433.30233.302

22.67133.38368.3812.67133.38368.3812.64633.07066.372

31.28816.10484.4851.28816.10484.4851.44918.11384.485

4.81810.22594.710

5.2212.75797.466

6.1541.92299.389

7.038.47899.867

8.011.133100.000

综合因子F,,F2,F3的特征值大于1,且对原始数据的累积贡献率达到了

84.485%,其中F1的贡献率最强,达到了34.998%,F2的贡献率达到了

33.383%,F3的贡献率也达到了16.104%。这三个因子的贡献率都远远大于其

它因子的贡献率,因此,F1,F2,F3是决定商业银行竞争力强弱的关键因子。

从碎石图中得到,第1个因子的特征值高于其他项,对解释原有变量的贡献最大;

第5个因子之后的特征值都小,对解释原有变量的贡献较小;因此我们可以取3

个或4个因子较为合适。

成分矩阵a

成分

123

总资产增长率.897-.157.187

存款增长率.892.400.150

贷款增长率.685.607.339

资本充足率-.367.873.175

资产负债率.475-.822-.104

每股收益增长率-.107-.789.391

资产利润率-.596-.006.680

不良贷款率-.040.239-.678

提取方法:主成分分析法。a

a.提取了3个成分。

表中给出旋转前的因子载荷阵,从中可以看出,每个因子在不同原始变量上

的载荷没有明显的差别,3个因子的实际含义比较模糊。为了避免初始因子综合

性太强,难以找出因子的实际意义的问题,需要通过旋转坐标轴,使负载尽可能

向正负0或1的方向靠近,从而降低因子的综合性,使其真实意义凸现出来。下

面使用的因子旋转方法为方差最大正交旋转法,目的是使旋转后的因子载荷矩阵

的结构简化,便于对各个公共因子进行合理的解释,同时保证每一个公共因子反

映的信息量尽量最大。

旋转后的成分矩阵a

成分

123

资本充足率-.962.051.020

资产负债率.951.084.011

每股收益增长率.602-.267.593

存款增长率-.001.977-.153

贷款增长率-.302.928.016

总资产增长率.493.788.023

资产利润率-.347-.322.771

不良贷款率-.131-.151-.692

提取方法:主成分分析法。

旋转方法:凯撒正态化最大方差法。a

a.旋转在4次迭代后已收敛。

表中给出旋转后的因子载荷阵,从表中可以看出,经过旋转后的载荷系数已

经明显的两极分化了。第一个公共因子在指标X2每股收益增长率、X3资产负债

率、X4资本充足率上有较大载荷,说明这3个指标有较强的关联性,可以归为

一类,因此可以把第一个因子命名为

“流动因子”;第二个公共因子在指标X6贷款增长率、X7存款增长率、

X8总资产增长率上有较大载荷,同样可以归为一类,第二个因子可以命名为“发

展因子”;同理,X1资产利润率、X5不良贷款率归到第3类,将其命名为“安

全和盈利因子”。

在三维空间组件图中,各因子更接近于组价几,接近组件几对应的是‘旋转

后的成分矩阵’的成分几。

成分得分系数矩阵

成分

123

资产利润率-.165-.029.544

不良贷款率-.009-.138-.516

资产负债率.359.012-.034

资本充足率-.368.046.072

每股收益增长率.203-.051.370

贷款增长率-.138.378.137

存款增长率-.016.371.003

总资产增长率.167.304.083

提取方法:主成分分析法。

旋转方法:凯撒正态化最大方差法。

组件得分。

表中给出了因子得分系数矩阵,根据表中的因子得分系数和原始变量的标准

化值就可以计算出每个观测值的各因子的得分。旋转后的因子得分表达式可以写

成:

F1=-0.165x1+0.203x2+0.359x3-0.368x4-0.009x5-0.138x6-0.016x7+0.167x8

F2=-0.029x1-0.051x2+0.012x3+0.046x4-0.138x5+0.378x6+0.371x7+0.304x8

F3=0.544x1+0.370x2-0.034x3+0.072x4-0.516x5+0.137x6+0.003x7+0.083x8

五、结论

本文通过采用多元统计分析中的因子分析法对国有商业银行的经营绩效加以

评价,从盈利能力、安全能力和发展能力三方面来具体分析我国上市商业银行竞

争力,对上市银行及非上市银行具有一定的指导作用。

实验项目:商厦评分

(一)实验目的:

本实验目的利用SPSS层次聚类对商厦评分进行分类分析,以了解了解各商厦之

间的相互关系。

(二)实验资料:

编号购物环境服务质量

A商厦7368

B商厦6664

C商厦8482

D商厦9188

E商厦9490

(三)实验步骤:

表一

聚类成员

个案3个聚类2个聚类

1:A商厦

11

2:B商厦

11

3:C商厦

22

4:D商厦

32

5:E商厦

32

表一可知,当聚成3类时,A,B俩个商厦为一类,C商厦自成一类,D,E

两个商厦为一类;当聚成两类时,A,B俩个商厦为一类,C,D,E三个商厦为一

类,SPSS的层次聚类能够产生任意类数的分类结果。

图一

图一,可知,D商厦与E商厦的距离最近,首先合并成一类,其次,合并的

是A,B俩个商厦它们的距离比D商厦与E商厦大,最后是合并C商厦。最后聚

城一体。

图二:

图二,可知,当聚成4类时,D,E两个商厦为一类;其他各商厦自成一类,

聚成

3类时,A,B俩个商厦为一类,C商厦自成一类,D,E两个商厦为一类;当

聚成两类时,A,B俩个商厦为一类,C,D,E三个商厦为一类。

表二

初始聚类中心

聚类

123

购物环境94.0066.0084.00

服务质量90.0064.0082.00

表二,可知,3个初始类中心点的数据,分别为(94,90)(66,64)(84,82)

可见第一类最优,第三类次之,第二类最差。

表三

迭代历史记录a

迭代

聚类中心中的变动

123

11.8034.031.000

2.000.000.000

a.由于聚类中心中不存在变动或者仅有小幅变

动,因此实现了收敛。任何中心的最大绝对坐标

变动为.000。当前迭代为2。初始中心之间的

最小距离为12.806。

表三,可知,第一次迭代后,3个类中心点分别偏移了1.803,4.013.0.000,

第2类中心点的偏移最大,在第3类和第二次迭代时中心点偏移均小于判定标准

(0.02),聚类分析结束。

表四

最终聚类中心

聚类

123

购物环境92.5069.5084.00

服务质量89.0066.0082.00

表四,可知,最终类中心点的情况,分别为(92.5,89)(69.5,66)(84,82)

仍然可见第一类为最优,第三类第二,第二类效果最差。

表五

ANOVA

聚类误差F显著性

均方自由度均方自由度

购物环境268.100214.500218.490.051

服务质量272.60025.000254.520.018

由于已选择聚类以使不同聚类中个案之间的差异最大化,因此F检验只应该用于描述目

的。实测显著性水平并未因此进行修正,所以无法解释为针对“聚类平均值相等”这一假

设的检验。

由表五,展现了各指标在不同的均值比较情况,各数据项的含义依次为组间

均方、组间自由度、组内均方、组内自由度、F统计量的观察值以及对应的概率

P-值。仍然看出第二类的差异最大。

(三)实验结论:

因此,在总数为五,有效数值为五的情况下的聚类分析可得,E商厦属最优

类;C,D商厦属良好类;A,B商厦属合格类。

(注:文档可能无法思考全面,请浏览后下载,供参考。可复制、编制,期待

你的好评与关注!)

更多推荐

聚类分析案例