判别分析实验报告SPSS 本文关键词:判别,实验,报告,分析,SPSS
判别分析实验报告SPSS 本文简介:一、实验目的及要求:1、目的用SPSS软件实现判别分析及其应用。2、内容及要求用SPSS对实验数据利用Fisher判别法和贝叶斯判别法,建立判别函数并判定宿州、广安等13个地级市分别属于哪个管理水平类型。二、仪器用具:仪器名称规格/型号数量备注计算机1有网络环境SPSS软件1三、实验方法与步骤:准备
判别分析实验报告SPSS 本文内容:
一、实验目的及要求:
1、目的
用SPSS软件实现判别分析及其应用。
2、内容及要求
用SPSS对实验数据利用Fisher判别法和贝叶斯判别法,建立判别函数并判定宿州、广安等13个地级市分别属于哪个管理水平类型。
二、仪器用具:
仪器名称
规格/型号
数量
备注
计算机
1
有网络环境
SPSS软件
1
三、实验方法与步骤:
准备工作:把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中,同时,由于只有当被解释变量是属性变量而解释变量是度量变量时,判别分析才适用,所以将城市管理的7个效率指数变量的变量类型改为“数值(N)”,度量标准改为“度量(S)”,以备接下来的分析。
四、实验结果与数据处理:
表1
组均值的均等性的检验
Wilks
的
Lambda
F
df1
df2
Sig.
综合效率标准指数
.582
23.022
2
64
.000
经济效率标准指数
.406
46.903
2
64
.000
结构效率标准指数
.954
1.560
2
64
.218
社会效率标准指数
.796
8.225
2
64
.001
人员效率标准指数
.342
61.645
2
64
.000
发展效率标准指数
.308
71.850
2
64
.000
环境效率标准指数
.913
3.054
2
64
.054
表1是对各组均值是否相等的检验,由该表可以看出,在0.05的显著性水平上我们不能拒绝结构效率标准指数和环境效率标准指数在三组的均值相等的假设,即认为除了结构效率标准指数和环境效率标准指数外,其余五个标准指数在三组的均值是有显著差异的。
表2
对数行列式
group
秩
对数行列式
1
6
-33.410
2
6
-33.177
3
6
-40.584
汇聚的组内
6
-32.308
打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。
表3
检验结果
箱的
M
140.196
F
近似。
2.498
df1
42
df2
1990.001
Sig.
.000
对相等总体协方差矩阵的零假设进行检验。
以上是对各组协方差矩阵是否相等的Box’M检验,表2反映协方差矩阵的秩和行列式的对数值。由行列式的值可以看出,协方差矩阵不是病态矩阵。表3是对各总体协方差阵是否相等的统计检验,由F值及其显著水平,在0.05的显著性水平下拒绝原假设,认为各总体协方差阵不相等。
1)Fisher判别法:
图一
图二
表4
特征值
函数
特征值
方差的
%
累积
%
正则相关性
1
3.763a
75.0
75.0
.889
2
1.257a
25.0
100.0
.746
a.
分析中使用了前
2
个典型判别式函数。
表5
Wilks
的
Lambda
函数检验
Wilks
的
Lambda
卡方
df
Sig.
dimension0
1
到
2
.093
146.042
12
.000
2
.443
50.053
5
.000
表4反映了判别函数的特征值、解释方差的比例和典型相关系数。第一判别函数解释了75%的方差,第二判别函数解释了25%的方差,它们两个判别函数解释了全部方差。
表5是对两个判别函数的显著性检验,由Wilks’Lambda检验,认为两个判别函数在0.05的显著性水平上是显著的。
表6
标准化的典型判别式函数系数
函数
1
2
综合效率标准指数
-.228
-.578
经济效率标准指数
.566
.404
结构效率标准指数
.097
.472
社会效率标准指数
.378
.233
人员效率标准指数
-.328
1.099
发展效率标准指数
.621
.675
表7
结构矩阵
函数
1
2
发展效率标准指数
.752*
.305
经济效率标准指数
.611*
.222
综合效率标准指数
.426*
.170
社会效率标准指数
.261*
-.001
环境效率标准指数a
.141*
-.129
人员效率标准指数
-.547
.797*
结构效率标准指数
.070
-.156*
判别变量和标准化典型判别式函数之间的汇聚组间相关性
按函数内相关性的绝对大小排序的变量。.
每个变量和任意判别式函数间最大的绝对相关性
a.
该变量不在分析中使用。
表6为标准化的判别函数,表7为结构矩阵,即判别载荷。由判别权重和判别载荷可以看出发展效率标准指数、经济效率标准指数对判别函数1的贡献较大,而人员效率标准指数对判别函数2的贡献较大。
表8
典型判别式函数系数
函数
1
2
综合效率标准指数
-5.216
-13.231
经济效率标准指数
5.168
3.688
结构效率标准指数
.999
4.848
社会效率标准指数
4.877
3.011
人员效率标准指数
-3.319
11.138
发展效率标准指数
7.145
7.774
(常量)
-1.363
-6.424
非标准化系数
表9
组质心处的函数
group
函数
1
2
dimension0
1
-.210
-.730
2
3.964
1.263
3
-2.725
1.905
在组均值处评估的非标准化典型判别式函数
表8为非标准化的判别函数,我们可以根据这个判别函数计算每个观测的判别Z得分。表9反映判别函数在各组的重心。根据结果,判别函数在group=1这一组的重心为(-0.210,-0.730),在group=2这一组的重心为(3.964,1.263),在group=3这一组的重心为(-2.725,1.905)。这样,我们就可以根据每个观测的判别Z得分将观测进行分类。
表10
组的先验概率
group
先验
用于分析的案例
未加权的
已加权的
dimension0
1
.333
46
46.000
2
.333
10
10.000
3
.333
11
11.000
合计
1.000
67
67.000
表11
分类结果b,c
group
预测组成员
合计
1
2
3
初始
计数
1
46
0
0
46
2
0
10
0
10
3
2
0
9
11
未分组的案例
6
3
3
12
%
1
100.0
.0
.0
100.0
2
.0
100.0
.0
100.0
3
18.2
.0
81.8
100.0
未分组的案例
50.0
25.0
25.0
100.0
交叉验证a
计数
1
45
0
1
46
2
1
9
0
10
3
2
0
9
11
%
1
97.8
.0
2.2
100.0
2
10.0
90.0
.0
100.0
3
18.2
.0
81.8
100.0
a.
仅对分析中的案例进行交叉验证。
在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。
b.
已对初始分组案例中的
97.0%
个进行了正确分类。
c.
已对交叉验证分组案例中的
94.0%
个进行了正确分类。
表10为各组的先验概率,在分类选项中选择的是所有组的先验概率相等。
表11为分类矩阵表,这里交叉验证是采用“留一个在外”的原则,即每个城市是通过除了这个城市以外的其他城市推导出来的判别函数来分类的。由该表可以看出,通过判别函数预测,有65个城市是分类正确的,其中,group=1组46个城市全部被判对,group=2组的10个城市也全部被判对,group=3组11个城市中有9个被判对,即有97%的原始城市被判对。在交叉验证中,三组中分别有45、9、9个城市被判对,交叉验证有94%的城市被判对。
图三
图三为分类结果图,从图中可以看到第2组与第3组可以很清晰地分开,与第1组也能分开,而第3组和第1组存在重合区域,即存在误判。
同时,根据对待判城市的判别可以看出:在13个待判城市中,宿州、广安、河地被判到了第3组,佛山、苏州、东营被判到了第2组,咸阳、盘锦、汉中、保定、宝鸡、衡阳被判到了第1组,而以纯由于只有环境效率标准指数的值,其他变量值确实,系统未对其进行判别。
2)贝叶斯判别法:
图四
图五
贝叶斯判别法输出的结果与Fisher判别法很大程度上是一致的,这里不再列出。
表12
组的先验概率
group
先验
用于分析的案例
未加权的
已加权的
dimension0
1
.687
46
46.000
2
.149
10
10.000
3
.164
11
11.000
合计
1.000
67
67.000
表13
分类函数系数
group
1
2
3
综合效率标准指数
-89.225
-137.370
-110.980
经济效率标准指数
18.318
47.236
15.041
结构效率标准指数
112.414
126.246
122.679
社会效率标准指数
61.509
87.864
57.179
人员效率标准指数
77.419
85.768
115.125
发展效率标准指数
57.663
102.980
60.184
(常量)
-46.457
-74.840
-66.632
Fisher
的线性判别式函数
表12为各族的先验概率,在分组选项中选择的是“根据组大小计算”。
表13展示了每组的分类函数,也称费歇线性判别函数,由表中的结果可以说明:group=1这一组的分类函数为:
=-
46.457-89.225综合效率标准指数+18.318经济效率标准指数
+112.414结构效率标准指数+61.509社会效率标准指数
+77.419人员效率标准指数+57.663发展效率标准指数
其他两组的分类函数同样可以写出,我们可以根据每个城市在各组的分类函数值然后将城市分类到较大的分类函数值中。
表14为贝叶斯判别的分类结果,其交叉验证有95.5%的城市被判对,这一概率比Fisher判别要高。
表14
分类结果b,c
group
预测组成员
合计
1
2
3
初始
计数
1
46
0
0
46
2
0
10
0
10
3
2
0
9
11
未分组的案例
6
3
3
12
%
1
100.0
.0
.0
100.0
2
.0
100.0
.0
100.0
3
18.2
.0
81.8
100.0
未分组的案例
50.0
25.0
25.0
100.0
交叉验证a
计数
1
46
0
0
46
2
1
9
0
10
3
2
0
9
11
%
1
100.0
.0
.0
100.0
2
10.0
90.0
.0
100.0
3
18.2
.0
81.8
100.0
a.
仅对分析中的案例进行交叉验证。
在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。
b.
已对初始分组案例中的
97.0%
个进行了正确分类。
c.
已对交叉验证分组案例中的
95.5%
个进行了正确分类。
五、讨论与结论
(1)由前面的分析我们知道,协方差矩阵并不相等,考虑采用分组协方差矩阵。在分类中使用协方差矩阵“分组(P)”,其他选择同上,得到分类结果表如下。
分类结果a
group
预测组成员
合计
1
2
3
初始
计数
1
44
0
2
46
2
0
10
0
10
3
0
0
11
11
未分组的案例
6
3
3
12
%
1
95.7
.0
4.3
100.0
2
.0
100.0
.0
100.0
3
.0
.0
100.0
100.0
未分组的案例
50.0
25.0
25.0
100.0
a.
已对初始分组案例中的
97.0%
个进行了正确分类。
可以看出这个结果与采用组内协方差矩阵的预测效果没有明显的差别,而且分类结果图与图三也没有很大的差异,因此,可以采用组内协方差矩阵来进行判别。
(2)之前的分析是采用“一起输入自变量”的方法,由表1可知,在0.05的显著性水平上不能拒绝结构效率标准指数和环境效率标准指数在三组的均值相等的假设,考虑“使用步进式方法”,最终确定进入分析的变量有3个:经济效率标准指数、人员效率标准指数、发展效率标准指数,上表给出了最终的分类结果,可以看出,在原有数据的所有城市中,有95.5%的城市被判对,在交叉验证中有92.5%的城市被判对。没有“一起输入自变量”时的效果好,但是在最终对待判城市的分组问题上,两种方法所得到的结果是一致的,在这里两种方法的选择对我们所需要的结果影响不是很大!
分类结果b,c
group
预测组成员
合计
1
2
3
初始
计数
1
45
1
0
46
2
0
10
0
10
3
2
0
9
11
未分组的案例
6
3
3
12
%
1
97.8
2.2
.0
100.0
2
.0
100.0
.0
100.0
3
18.2
.0
81.8
100.0
未分组的案例
50.0
25.0
25.0
100.0
交叉验证a
计数
1
44
2
0
46
2
1
9
0
10
3
2
0
9
11
%
1
95.7
4.3
.0
100.0
2
10.0
90.0
.0
100.0
3
18.2
.0
81.8
100.0
a.
仅对分析中的案例进行交叉验证。
在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。
b.
已对初始分组案例中的
95.5%
个进行了正确分类。
c.
已对交叉验证分组案例中的
92.5%
个进行了正确分类。