数理统计和Matlab上机报告 本文关键词:数理,上机,统计,报告,Matlab
数理统计和Matlab上机报告 本文简介:统计分析软件(matlab)实验报告1序号班级姓名学号日期时间地点信计1302张温柔4136309620150706实验楼102指导教师:李娜实验名称:1、matlab基本操作、概率计算实验任务:【练习1_01】生成(a,b)上的均匀分布的随机数;生成N(nu,sigma.^2)上的正态分布的随机数
数理统计和Matlab上机报告 本文内容:
统计分析软件(matlab)实验报告1
序号
班级
姓名
学号
日期
时间
地点
信计1302
张温柔
41363096
20150706
实验楼102
指导教师:李娜
实验名称:
1、
matlab基本操作、概率计算
实验任务:
【练习1_01】生成(a,b)上的均匀分布的随机数;生成N(nu,sigma.^2)上的正态分布的随机数。
【练习1_02】求个人中至少有两个人生日相同的概率
【练习1_03】
20个黑白棋子,随机抽出10个,求(1)10个一色(2)9个一色(3)8个一色(4)7个一色(5)6个一色(6)5个一色的概率。
【练习1_04】
将编号为的本书任意地排列在书架上,求至少有一本书自左到右的排列序号与它的编号相同的概率。
【练习1_05】
求一个三位数之和为的概率。
【练习1_06】
(1)生成个二项分布的随机数,统计出每个可能取值的频数、频率;(2)计算其分布律,分别用数值和图形进行对比;(3)算出理论上最可能的取值点并于实际随机数进行比较。
【练习1_07】
画正态分布的概率密度函数曲线,产生个相应的随机数,画出直方图和带正态密度曲线的直方图。将随机数的频率曲线与概率密度函数曲线画在一起进行比对。
【练习1_08】
对不同的参数,画出分布的概率密度函数曲线,讨论的不同变化对曲线的影
响。
【练习1_09】
设,求,
【练习1_10】
求标准正态分布的临界值并画图。
【练习1_11】求分布的双侧临界值并画图(变换不同的)。
【练习1_12】
选择两种离散型和两种连续性随机变量,(1)写出它们的分布,求出相应的数学期望、标准差、方差;(2)产生相应的随机数,求出样本的均值、标准差、方差。
【练习2.01】
(填充,二维均匀随机数)产生二维均匀分布和正态分布随机数,填充画图并将二维随机点画在一起。
【练习2_02】
(使用命令进行参数估计)
【练习2_03】
(编程实现参数估计,置信区间)
【练习2_04】
(编程实现参数估计,置信区间)
随机地从A批导线中抽取4根,从B批导线中抽取5根,测得电阻数据如下,
A:0.143,0.142,0.143,0.137
B:0.140,0.142,0.136,0.138,0.140
【练习3_01】
(编程实现两个正态总体的假设检验)
(1)从两处煤矿各抽样数次,分析其含灰率(%)如下:甲矿:24.3,20.8,23.7,21.3,17.4,乙矿:18.2,16.9,20.2,16.7;假定各煤矿含灰率服从正态分布,向甲,乙矿煤的含灰率有无显著差异?
(2)以下分别是数学和信计各两个班的概率统计成绩,检验数学1-2班成绩是否有显著差异,信计1-2班成绩是否有显著差异
99
99
98
92
92
91
91
89
89
88
87
87
87
87
85
85
84
84
83
83
82
82
80
78
77
77
68
60
99
94
93
93
91
90
90
89
88
88
88
87
87
87
86
84
84
83
82
82
82
82
81
80
77
77
75
70
94
93
90
88
87
86
86
84
82
81
80
78
77
77
77
76
74
73
73
72
72
72
71
71
70
63
63
62
61
60
95
95
90
89
87
86
84
81
81
79
79
79
79
78
77
77
77
73
71
71
70
70
70
67
65
65
64
64
63
62
62
61
60
60
【练习3_02】(离散型分布检验)
某工厂近五年发生了63起事故,按星期几可以分为[9
10
11
8
13
12],问该厂发生的事故数是有与星期几有关?
【练习3_03】((连续性分布检验)
随机地抽取某年某月新生儿(男)50名,测其体重如下:
2520
3540
2600
3320
3120
3400
2900
2420
3280
3100
2980
3160
3100
3460
2740
3060
3700
3460
3500
1600
3100
3700
3280
2880
3120
3800
3740
2940
3580
2980
3700
3460
2940
3300
2980
3480
3220
3060
3400
2680
3340
2500
2960
2900
4600
2780
3340
2500
3300
3640
【练习3_04】(独立性检验)检验成绩分数段[0
60
70
80
90
100.1]的分布与课程是否独立。
【练习3_05】(K检验法)考察某台仪器的无故障工作时间12次,
得数据为:28,42,54,92,138,159,169,181,210,234,236,265.问无故障工作时间是否服从的指数分布。
实验目的:
1.
熟悉MATLAB在概率统计中的若干命令和使用格式。
2.
学会用Matlab填充画图的方法。
3.
熟悉Matlab的各种分布基本指令,并学会用Matlab编程实现临界值的图形表示。
4.
求各种随机变量的各种数字特征。
运行结果:
【练习1_01】
均匀分布
unifrnd
(1,500,6,6)
ans
=
407.3281
308.4063
458.6796
38.8513
284.8430
156.2963
122.5190
237.1711
143.6337
27.9211
235.2259
264.7380
464.7025
176.4781
378.8429
265.8680
6.9391
83.6587
175.6419
415.5835
377.1108
389.8044
169.2242
301.3890
99.1010
293.0468
190.8425
467.0713
81.9290
132.2227
126.2908
275.3121
284.3430
65.8232
397.3480
327.3855
正态分布
normrnd(5,5,6,6)
ans
=
8.6968
-0.3608
-1.0392
3.6377
0.8821
10.6375
13.5594
9.8048
19.5400
10.4921
-2.8853
6.7509
4.0294
5.6202
9.1261
3.6106
7.5399
3.5047
-5.6918
12.1835
11.8949
8.5077
6.4099
5.1144
0.8021
-4.8045
-0.2909
-5.2591
5.1674
3.6900
11.7730
4.0115
2.6569
3.2308
-1.6684
-3.7511
【练习1_02】
Rs
=[20
25
30
35
40
45
50
]
P_r=[0.4114
0.5687
0.7063
0.8144
0.8912
0.9410
0.9704]
【练习1_03】
A=9.7656e-04
B=0.0098
C=
0.0439
D=0.1172
E=
0.2051
F=
0.2461
【练习1_04】
ans
=
0.6667
【练习1_05】
p
=
0.0400
【练习1_06】
x
=
2
3
3
2
3
4
4
5
3
3
3
2
1
6
4
4
2
4
5
5
3
2
6
4
4
2
3
4
2
2
3
1
3
3
4
3
1
4
5
4
4
2
3
7
3
3
5
4
2
1
4
4
3
6
3
3
3
2
2
4
2
2
2
2
3
2
2
2
2
2
1
3
1
3
5
2
1
4
2
1
2
5
4
2
4
2
6
1
2
7
2
3
2
6
3
7
7
4
3
2
Value
Count
Percent
1
9
9.00%
2
30
30.00%
3
25
25.00%
4
20
20.00%
5
7
7.00%
6
5
5.00%
7
4
4.00%
y
=
1
9
9
2
30
30
3
25
25
4
20
20
5
7
7
6
5
5
7
4
4
【练习1_07】
【练习1_08】
【练习1_09】
【练习1_10】
【练习1_11】
=0.2
=0.4
=0.5
【练习1_12】
a
=1
b
=
0.9000
c
=6.5000
d
=0.7500
e
=
1
f
=
2
g
=
0
h
=
3
y13
=
0.7000
y12
=0.6778
y13
=0.8233
y21
=
1
y22
=
0
y23
=
0
y31
=
0.9400
y32
=1.5721
y33
=
1.2538
y41
=211.5728
y42
=6.0689e+06
y43
=2.4635e+03
分析讨论:
1、
在生日问题的分析中,当n=25时,出项两个人的生日相同的概率已经升至0.5687,事件出现的概率已经很大,而从上列图中可以看到,无论是理论结果还是模拟结果,当观察的人数超过50人之后,几乎一定会出现生日相同的人。
2、
在随机数的频率曲线与概率密度函数曲线画接近一致,matlab随机取值非常接近正态分布。
3、在卡方分布中,n越增大,卡方分布越向中间位置集中,当n趋近于无穷大时近似正态分布。
4、改变卡方分布的临界值会改变双侧的面积。
心得体会:
在上一学期的概率论学习中就学过Matlab的基本数学运用,如今再进行编程计算有很多不习惯。再不不会利用函数时,知道函数名,直接用help
funname就可以得到相应的帮助信息。对于学习matlab,想要学会,使用熟练,不花时间练习,写代码,亲自运行调试,是很难掌握好的。使用Matlab画图可以非常形象的描述函数的特征,改变相应的函数值可以图形,从而很好的描述函数的变化特征。在小学期的学习中,我对Matlab产生了浓厚的兴趣,一个人一旦对某事物有了浓厚的兴趣,就会主动去求知、去探索、去实践,并在求知、探索、实践中产生愉快的情绪和体验。这样才能主动学习,并且学好到精通。
2015年
月
日
设计方案描述:
【练习1_01】利用随机分布函数产生随机数
【练习1_02】
1、求出n个人中至少有两个人生日相同的概率P(n)的近似公式;
2、
根据P(n)的近似公式,用计算机分别计算出当团体人数取n=1,2,……,
100时的概率值:P(25),P(2),……,P(50)。描述概率值随团体人
数变化的规律;
【练习1_03】
先计算抽到每一种颜色棋子的概率,然后利用密度函数公式解决问题。
【练习1_04】首先求每本书在自己标号位置的概率,相加为1.然后计算重复的两两交叉位
置的概率,计算每一种交叉位置的概率。最后用1减去两两交叉的概率之和
加上其余的交叉概率。
【练习1_05】利用matlab求概率分布,先假设出可能的取值,之后百位数除以100,十位
数除以10,和个位数一起构成的3位数相加得到k,累计取到k的个数n,
除以所有可能的个数900.
【练习1_06】利用随机分布函数产生随机数,然后统计频数频率。之后利用图形生成函数
画图,将理论图叠加至原图进行对比分析。
【练习1_07】利用正态分布函数命令画正态分布的概率密度函数曲线,利用政坛
分布函数随机数的产生产生个相应的随机数,画出直方图和带正
态密度曲线的直方图。将随机数的频率曲线与概率密度函数曲线叠加画在一
起进行比对。
【练习1_08】卡方分布函数中改变不同的n值,画图叠加在一个图中。
【练习1_09】利用函数的积累求两个端点的差值。
【练习1_10】设定标准正态分布的取值范围,利用函数求临界值并画图。
【练习1_11】利用函数x=norminv(x,n)画图,变换不同的n值并将图形叠加在一起。
【练习1_12】首先选择四种随机变量,分别为随机分布、二项分布、T分布和几何分布。利用函数写出它们的分布,求出相应的数学期望、标准差、方差;(2)产生相应的随机数,求出样本的均值、标准差、方差。
主要程序清单:
【练习1_01】
均匀分布
unifrnd
(1,500,6,6)
正态分布
normrnd(5,5,6,6)
【练习1_02】
for
k=[20
25
30
35
40
45
50]
p(k)=1-prod(365-k+1:365)/365^k
【练习1_03】
binopdf(10,10,0.5)
binopdf(9,10,0.5)
binopdf(8,10,0.5)
binopdf(7,10,0.5)
binopdf(6,10,0.5)
binopdf(5,10,0.5)
【练习1_04】
Ai=第i本书恰好在第i
个位置
B=至少有i本书在他的编号的位置
P(Ai)=(n-1)!/n!=1/n
假如n=3
p(B)=P(A1)+(A2)+(A3)-P(A1A2)-P(A2A3)-P(A1A2)+P(A1A2A3)
1-3*[1/prod(1:3)]+1/prod(1:3)
【练习1_05】
k=20
n=0
for
x=100:999
x1=fix(x/100);
x2=rem(fix(x/10),10);
x3=rem(x,10);
if
k==x1+x2+x3
n=n+1
end
end
【练习1_06】
x=binornd(10,0.3,10,10)
tabulate(x(:))
y=tabulate(x(:))
x0=0:1:10;
y1=y(:,1);
y2=y(:,3);
y3=y2/100;
plot(y1,y3)
【练习1_07】
x=-20:1:20;
y=normpdf(x,1,4);
z=normrnd(1,4,10000,1);
[x1,y1]
=
ecdf(z);
ecdfhist(x1,y1);
max=max(z);
min=min(z);
x=-20:1:20;
y=normpdf(x,1,4);
z=normrnd(1,4,10000,1);
plot(x,y,r
);
hold
on
[x1,y1]
=
ecdf(z);
ecdfhist(x1,y1);
max=max(z);
min=min(z);
m=linspace(min,max,20);
n=ksdensity(z,m);
plot(m,n,r-
);
hold
on
plot(x,y,b*
)
【练习1_08】
x
=
0:0.1:15;
y
=
chi2pdf(x,4);
plot(x,y,r
)
hold
on
x
=
0:0.1:15;
y
=
chi2pdf(x,5);
plot(x,y,y
)
hold
on
x
=
0:0.1:15;
y
=
chi2pdf(x,6);
plot(x,y,g
)
【练习1_09】
x=normspec([2,5],3,2)
y=normspec([-4,10],3,2)
z=1-normspec([-2,2],3,2)
r=1-normcdf(3,3,2)
【练习1_10】
x=0:0.1:1;
y=norminv(x,0,1)
plot(x,y)
【练习1_11】
=0.1
n=9;
a=0.1;
z=chi2inv(a,n);
r=chi2inv(1-a,n);
x=0:0.1:30;
y=chi2pdf(x,n);
plot(x,y,b
)
hold
on
x1=0:0.1:z;
y1=chi2pdf(x1,n);
x2=r:0.1:30;
y2=chi2pdf(x2,n);
fill([x1,z],[y1,0],b
)
fill([x2,r],[y2,0],b
)
【练习1_12】
[a,b]=binostat(10,0.1)
[c,d]=unifstat(5,8)
[e,f]=geostat
(0.5)
[g,h]=tstat
(3)
x1=binornd(10,0.1,1,10);
x2=unidrnd(1,1,100);
x3=geornd(0.5,1,100);
x4=trnd(0.6,1,100);
y13=mean(x1)
y12=var(x1)
y13=std(x1)
y21=mean(x2)
y22=var(x2)
y23=std(x2)
y31=mean(x3)
y32=var(x3)
y33=std(x3)
y41=mean(x4)
y42=var(x4)
y43=std(x4)
17
篇2:应用数理统计学课程实验报告
应用数理统计学课程实验报告 本文关键词:数理,统计学,课程,实验,报告
应用数理统计学课程实验报告 本文简介:学生学号201330170078实验课成绩学生实验报告书实验课程名称应用数理统计学课程实验开课学院土木与交通学院指导教师姓名胡郁葱学生姓名邓艳辉学生专业班级交通运输2014--2015学年第1学期上机实验一实验项目名称上机实验1实验日期2014.12.26实验者邓艳辉专业班级交通运输组别第二组一部分
应用数理统计学课程实验报告 本文内容:
学生学号
201330170078
实验课成绩
学
生
实
验
报
告
书
实验课程名称
应用数理统计学课程实验
开
课
学
院
土木与交通学院
指导教师姓名
胡郁葱
学
生
姓
名
邓艳辉
学生专业班级
交通运输
2014
--
2015
学年
第
1
学期
上机实验一
实验项目名称
上机实验1
实验日期
2014.12.26
实
验
者
邓艳辉
专业班级
交通运输
组
别
第二组
一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)
1、
实验目的:掌握SPSS的基本操作(认识SPSS、变量定义、变量属性理解、数据录入等)
2、
实验任务:设计“交通量调查表”的相关变量及属性,便于将纸质调查表转换为电子调查表,并导入数据。
3、
实验基本原理和方法:
一、定义变量
启动SPSS后,出现如图1-1所示数据编辑窗口。由于目前还没有输入数据,因此显示的是一个空文件。
输入数据前首先要定义变量。定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式。
1.定义变量名Name
SPSS默认的变量为Var00001、Var00002等。用户也可以根据自己的需要来命名变量。SPSS变量的命名和一般的编程语言一样,有一定的命名规则,具体内容如下:
(1)变量名必须以字母、汉字或字符@开头,其他字符可以是任何字母、数字或_、@、#、$等符号。
(2)变量最后一个字符不能是句号。
(3)变量名总长度不能超过8个字符(即4个汉字)。
4
(4)不能使用空白字符或共他待殊字符(如“!”、“?”等)。
(5)变量命名必须唯一,不能有两个相同的变量名。
(6)在SPSS中不区分大小写,例如,HXH、hxh或Hxh对SPSS而言,均为同一变量名称。
(7)SPSS的句法系统中表达逻辑关系的字符串不能作为变量的名称,如ALL、AND、WITH、OR等
2.定义变量类型Type
单击Type相应单元中的按钮,出现如图1-2所示的对话框,在对话框中选择合适的变量类型并单击OK按钮,即可定义变量类型。
SPSS的常用变量类型如下:
(1)Numeric:数值型。定义数值的宽度(Width),即“整数部分+小数点+小数部分”的位数,默认为8位;定义小数位数(Decimal
Places),默认为2位。
(2)Comma:加显逗号的数值型,即整数部分每3位数加一逗号,其余定义方式同数值型,也需要定义数值的宽度和小数位数。
(3)Scientific
notation:科学记数型。同时定义数值宽度(width)和小数位数(Decimal),在数据编辑窗口中以指数形式显示。如定义数值宽度为9,小数位数为2,345.678就显示为3.46E+02。
(4)Custom
currency:用户自定义型,如果没有定义,则默认显示为整数部分每3位加一逗号。用户可定义数值宽度和小数位数。如12345.678显示为12,345.678。
(5)String:字符型,用户可定义字符长度(Characters)以便输入字符。
3.变量长度Width
设置变量的长度,当变量为日期型时无效。
4.变量小数点位数Decimal
设置变量的小数点位数,当变量为日期型时无效。
5.变量标签Label
5
变量标签是对变量名的进一步说明或注释,变量只能由不超过8个字符组成,而8个字符经常不足以说清楚变量的含义。而变量标签可长达120个字符、可显示大小写,需要时可借此对变量名的含义加以较为清晰地解释。
6.变量值标签Values
Labels
变量值标签是对变量的每一个可能取值的进一步描述。当变量是称名变量或顺序变量时,这是非常有用的。例如,在统计中经常用不同的数字代表被试的性别是男或女;被试的职业是教师、警察、??,还是公务员;被试的教育程度是高中以下、本科、硕士、博士等信息。为避免以后对数字所代表的类别发生遗忘,就可以使用变量值标签加以说明和记录。比如用1代表“male”(男)、2代表“female”(女),其设置方法为:单击values相应单元,出现如图1-3所示的对话框;在第一个Value文本框内输入l,在第二个Value文本框内输入“male”;单击Add按钮;再重复这一过程完成变量值2的标签,就完成了该变量所有可能取值的标签的添加。
7.变量的显示宽度Columns
输入变量的显示宽度,默认为8。
8.变量的测量尺度Measure
前一章已经介绍,变量按测量水平可被划分称名变量、顺序或等级变量、等距变量和等比变量几种。这里可根据测量量表的不同水平设置对应的变量测量尺度,设置方式为:称名变量选择Nominal,顺序或等级变量选择Ordinal,等距或等比变量均选择Scale。
二、导入数据
SPSS支持多种文件数据的导入,且方便简单易行
第二部分:实验过程记录(可加页)(包括实验步骤,实验过程发现的问题等)
一、实验步骤
1/
2、如图。
3、
如图。
4、
定义各变量。
5/保存。
二、实验过程发现的问题或遇到的问题:
1、Excel表格给出的表格格式不是如上图所见的那样,所以应该对表格的范围有取舍,舍去A1:F2的区域,只取A3:F39
2、由于在打A3:F39时在输入法中没将中文转换为英文,导致导入数据错误
第三部分
实验总结
一、实验结果分析(包括数据处理结果、模型参数的含义、检验结论、结果分析等)
通过操作成功地将“交通量调查表”的数据导入到IBM
SPSS
Staticstics
20中并保存成为.sav文件。
二、小结、建议及体会
对于第一个实验,是比较基础的,是进行数据分析的第一步,对于我们熟悉SPSS的操作有很大的意义,虽说比较简单,但还是有一些细节要谨记,比如在上述遇到的问题。
上机实验二
实验项目名称
上机实验2
实验日期
2014.12.26
实
验
者
邓艳辉
专业班级
交通运输
组
别
第二组
一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)
1、
实验目的:掌握SPSS描述性特征变量计算操作(频数分布分析过程等)
2、
实验任务:根据实验1的数据,分析交通量(总计进出人数)特性,获取交通量(总计进出人数)与时间变化趋势图;对交通量(总计进出人数)进行探索分析(直方图、概率分布图、箱线图等);结合专业知识得出交通量变化的相关规律。
3、
实验基本原理和方法:
频数分析:频数分析可以计算一个或多个变量值的频数,百分数或各种描述统计量,能够产生条形图和直方图,揭示数据分布的特征,
2、探索分析:探索分析是对统计数据进行进一步考察的过程。对数据分析的首要一步是对数据进行初步的考察,具体是:(1)检查数据是否有误,特别是奇异值。(2)数据的分布特征。(3)对数据的特点和规律性的初步考察,以尽可能地发现一些内在的规律。
第二部分:实验过程记录(可加页)(包括实验步骤,实验过程发现的问题等)
一、频数分析
1、
“分析”→“描述分析”→“统计”。
2、选择进行频数分析的变量。
3、
选择是否输出频数表格。
4、
选择输出的统计量。
5、获取交通量(总计进出人数)与时间变化趋势图。
二、探索分析
1、分析”→“描述统计”→“探索”。
2、
选择进行探索分析的变量。
3、
选择是否输出统计描述和统计图。
4、设置统计图输出。
第三部分
实验总结
一、实验结果分析(包括数据处理结果、模型参数的含义、检验结论、结果分析等)
结合专业知识得出交通量变化的相关规律。
统计量
总计进出人数
N
有效
36
缺失
0
均值
64.42
中值
63.00
众数
50a
标准差
19.390
方差
375.964
偏度
.434
偏度的标准误
.393
峰度
-.297
峰度的标准误
.768
a.
存在多个众数。显示最小值
1、频数分析
(1)根据统计量表格可以看到,样本个数为36个,均值是64.42,中位数是63.00,众数是50。标准差是19.390.方差是375.964,偏度是0.434,峰度是-0.297,
(2)
从总计进出人数与时间变化趋势图可以看到,总计进出人数分布比较分散,
2、探索分析
(1)直方图
(2)
概率分布图
(3)
箱图。
二、小结、建议及体会
一开始对这个数据的分析有点弄不明白,看着参考教程呆呆地十几分钟没有进展,但经过师兄的指点逐渐掌握了一点操作步骤,但后面的分析还是花了一些时间。经过这个实验体验到了SPSS软件在构图分析方面的方便,在一些选择输出项的选择要根据自己所需的分析数据选择。
上机实验三
实验项目名称
上机实验3
实验日期
2014.12.26
实
验
者
邓艳辉
专业班级
交通运输
组
别
一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)
一、实验目的:掌握SPSS参数估计和假设检验操作(单个样本T检验和独立样本T检验等)
二、实验任务:对教材例5.2.5和例4.2.7进行操作,阐述检验的结论。
三、实验基本原理与方法
1、单样本T检验:SPSS单样本T检验是检验一个数据样本所在总体平均数与某特定值之间的差异性,统计检验的前提是样本所在的总体服从正态分布。
2、两独立样本T检验:独立样本平均值的差异T检验的前提是:(1)两个样本相互独立。(2)样本所来自的两个总体服从正态分布。具体步骤如下:
第二部分:实验过程记录(可加页)(包括实验步骤,实验过程发现的问题等)
一、单样本T检验:以“参考教程三例5”为例
1、定义变量,输入数据。
2、
“分析→比较均值→单样本T检验”。
3、“确定”。
二、独立样本T检验:以课本例4.2.7为例
1、定义变量、输入数据。
2、“分析→比较均值→独立样本T检验”。
单击继续,回到独立样本T检验对话框,点击确定,输出结果。
第三部分
实验总结
一、实验结果分析(包括数据处理结果、模型参数的含义、检验结论、结果分析等)
1、单样本T检验的结论:
单个样本统计量
N
均值
标准差
均值的标准误
分数
45
76.7333
8.69796
1.29662
单个样本检验
检验值
=
80
t
df
Sig.(双侧)
均值差值
差分的
95%
置信区间
下限
上限
分数
-2.519
44
.015
-3.26667
-5.8798
-.6535
2、两独立样本T检验:
组统计量
厂家
N
均值
标准差
均值的标准误
得分
1.00
5
87.8000
4.32435
1.93391
2.00
5
91.2000
2.77489
1.24097
二、小结、建议及体会
之前做作业的时候都是用EXCEL做的觉得也挺方便的,接触这个软件之后发现简便也不亚于EXCEL,但操作这个软件还是需要一些重复的操作来记住这些步骤。但由于显示的时候可以中文显示分析结果,这一点比EXCEL方便。
上机实验四
实验项目名称
上机实验4
实验日期
2014.12.26
实
验
者
邓艳辉
专业班级
交通运输
组
别
第二组
一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)
一、实验目的:SPSS方差分析(单因素、双因素方差分析等)
二、实验任务:单因素方差分析在教材P158复习思考题5和6任选一题进行操作;双因素方差分析可尝试对“案例讨论题”进行操作(时间充分可做)。
三、实验基本原理和方法:
1、利用spss进行方差分析的一般过程:
(1)建立正确的数据文件;
(2)选择正确的方法分析类型;
(3)对话框结构与变量配置;
(4)功能设置;
(5)结果的输出与选择。
2、单因素方差分析:
3、
多因素方差分析。
第二部分:实验过程记录(可加页)(包括实验步骤,实验过程发现的问题等)
一、单因素方差分析:以教材复习思考题5为例
1、定义变量、输入数据。
2、
“分析→比较均值→单因素”将“机器类型”设置为“因子”,“厚度”设置为“因变量”。
3、
如图。
4、
5、单击确定,输入结果。
第三部分
实验总结
一、实验结果分析(包括数据处理结果、模型参数的含义、检验结论、结果分析等)
实验输出结果如下:
描述
厚度
N
均值
标准差
标准误
均值的
95%
置信区间
极小值
极大值
下限
上限
1.000
5
.24200
.004950
.002214
.23585
.24815
.236
.248
2.000
5
.25600
.003162
.001414
.25207
.25993
.253
.261
3.000
5
.26200
.003674
.001643
.25744
.26656
.258
.267
总数
15
.25333
.009431
.002435
.24811
.25856
.236
.267
方差齐性检验
厚度
Levene
统计量
df1
df2
显著性
.945
2
12
.416
。
单因素方差分析
厚度
平方和
df
均方
F
显著性
组间
.001
2
.001
32.917
.000
组内
.000
12
.000
总数
.001
14
F=32.917,故拒绝原假设,即每台机器生产的薄板厚度有显著差异.
多重比较
因变量:
厚度
LSD
(I)
机器类型
(J)
机器类型
均值差
(I-J)
标准误
显著性
95%
置信区间
下限
上限
1.000
2.000
-.014000*
.002530
.000
-.01951
-.00849
3.000
-.020000*
.002530
.000
-.02551
-.01449
2.000
1.000
.014000*
.002530
.000
.00849
.01951
3.000
-.006000*
.002530
.035
-.01151
-.00049
3.000
1.000
.020000*
.002530
.000
.01449
.02551
2.000
.006000*
.002530
.035
.00049
.01151.
均值差的显著性水平为
0.05。
二、小结、建议及体会
小结:通过定义变量,输入数据,正确选择分析选项,分析变量和因子,勾选正确的输出选项,得出分析结果,对比得出答案。这个跟EXCEL
很相似,操作也差不多,所以还是比较容易操作和记住步骤的。
上机实验五
实验项目名称
上机实验5
实验日期
2014.12.26
实
验
者
邓艳辉
专业班级
交通运输
组
别
第二组
一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)
一、实验目的:掌握SPSS回归分析操作(一元线性回归分析、多元线性回归分析等)
二、实验任务:操作教材第6章的案例讨论题,并完成讨论题中的任意3个问题。
三、实验基本原理和方法
1、相关分析。
(1)准备数据。
(2)根据问题需要,进行相关性分析。
2、
一元线性回归
3、多元线性回归
在SPSS中,多元线性回归和一元线性回归采用相同的命令。区别在于,多元线性回归在选择自变量时要选择多个自变量。
4、
曲线估计
第二部分:实验过程记录(可加页)(包括实验步骤,实验过程发现的问题等)
多元线性回归:以教材第六章案例讨论题为例
1、
定义变量、输入数据
2、
如图。
3、单击“确定”按钮。
第三部分
实验总结
1、
实验结果分析(包括数据处理结果、模型参数的含义、检验结论、结果分析等)
实验所得结果如下:
输入/移去的变量a
模型
输入的变量
移去的变量
方法
1
各项贷款余额x1
.
步进(准则:
F-to-enter
的概率
=
.100)。
2
本年累计应收贷款x2
.
步进(准则:
F-to-enter
的概率
=
.100)。
a.
因变量:
不良贷款y
模型汇总
模型
R
R
方
调整
R
方
标准
估计的误差
1
.846a
.715
.703
1.9657
2
.873b
.762
.740
1.8364
a.
预测变量:
(常量),各项贷款余额x1。
b.
预测变量:
(常量),各项贷款余额x1,本年累计应收贷款x2。
Anovaa
模型
平方和
df
均方
F
Sig.
1
回归
222.979
1
222.979
57.707
.000b
残差
88.871
23
3.864
总计
311.850
24
2
回归
237.657
2
118.828
35.235
.000c
残差
74.194
22
3.372
总计
311.850
24
a.
因变量:
不良贷款y
b.
预测变量:
(常量),各项贷款余额x1。
c.
预测变量:
(常量),各项贷款余额x1,本年累计应收贷款x2。
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准
误差
试用版
1
(常量)
-.679
.734
-.925
.365
各项贷款余额x1
.038
.005
.846
7.597
.000
2
(常量)
-1.358
.759
-1.790
.087
各项贷款余额x1
.029
.006
.646
4.564
.000
本年累计应收贷款x2
.169
.081
.295
2.086
.049
a.
因变量:
不良贷款y
已排除的变量a
模型
Beta
In
t
Sig.
偏相关
共线性统计量
容差
1
本年累计应收贷款x2
.295b
2.086
.049
.406
.541
贷款项目个数x3
-.103b
-.480
.636
-.102
.277
本年固定资产投资额x4
-.342b
-2.051
.052
-.401
.391
2
贷款项目个数x3
-.094c
-.468
.645
-.102
.277
本年固定资产投资额x4
-.305c
-1.932
.067
-.388
.386
a.
因变量:
不良贷款y
b.
模型中的预测变量:
(常量),各项贷款余额x1。
c.
模型中的预测变量:
(常量),各项贷款余额x1,本年累计应收贷款x2。
讨论题:
(1)绘制得到散点图如下:
从以上四图可以看到。贷款余额x1、本年累计应收贷款x2的点较为集中,可以用一条直线进行拟合,说明它们和不良贷款之间是线性相关关系。但是可以看到它们也并不是密切集中到一条线的两侧而是比较分散,故线性相关强度应该是中度。而贷款项目x3、本年固定资产投资额x4的分布则更加分散,可以认为它们与不良贷款之间没有线性相关关系。而实验中这两个因素被剔除也证明了这一一点。
(2)
由系数表格可以得到线性回归方程为:。回归系数0.029表示贷款余额x1对不良资产的影响程度,回归系数0.169表示本年累计应收贷款x2对不良资产的影响程度。
二、小结、建议及体会
操作比较简单,但是分析结果比较繁杂,理解还要花一点时间,得出的结论和线性回归方程能对所给的数据比较好地模拟,从散点图看出它与模型的相关程度从而佐证软件的分析结果。
篇3:概率论与数理统计期末考试之置信区间与拒绝域含答案
概率论与数理统计期末考试之置信区间与拒绝域含答案 本文关键词:概率论,数理,置信,区间,期末考试
概率论与数理统计期末考试之置信区间与拒绝域含答案 本文简介:概率论与数理统计期末置信区间问题八(1)、从某同类零件中抽取9件,测得其长度为(单位:mm):6.05.75.86.57.06.35.66.15.0设零件长度X服从正态分布N(μ,1)。求μ的置信度为0.95的置信区间。解:由于零件的长度服从正态分布,所以所以的置信区间为经计算的置信度为0.95的置
概率论与数理统计期末考试之置信区间与拒绝域含答案 本文内容:
概率论与数理统计期末
置信区间问题
八(1)、从某同类零件中抽取9件,测得其长度为(
单位:mm
):
6.0
5.7
5.8
6.5
7.0
6.3
5.6
6.1
5.0
设零件长度X服从正态分布N
(μ,1)。求μ的置信度为0.95的置信区间。
解:由于零件的长度服从正态分布,所以
所以的置信区间为
经计算
的置信度为0.95的置信区间为
即(5.347,6.653)
八(2)、某车间生产滚珠,其直径X
~N
(,0.05),从某天的产品里随机抽出9个量得直径如下(单位:毫米
):
14.6
15.1
14.9
14.8
15.2
15.1
14.8
15.0
14.7
若已知该天产品直径的方差不变,试找出平均直径的置信度为0.95的置信区间。
解:由于滚珠的直径X服从正态分布,所以
所以的置信区间为:
经计算
的置信度为0.95的置信区间为
即(14.765,15.057)
八(3)、工厂生产一种零件,其口径X(单位:毫米)服从正态分布,现从某日生产的零件中随机抽出9个,分别测得其口径如下:
14.6
14.7
15.1
14.9
14.8
15.0
15.1
15.2
14.7
已知零件口径X的标准差,求的置信度为0.95的置信区间。
解:由于零件的口径服从正态分布,所以
所以的置信区间为:
经计算
的置信度为0.95的置信区间为
即(14.802,14.998)
八(4)、随机抽取某种炮弹9发做实验,测得炮口速度的样本标准差S=3(m/s),设炮口速度服从正态分布,求这种炮弹的炮口速度的方差的置信度为0.95的置信区间。
因为炮口速度服从正态分布,所以
的置信区间为:
的置信度0.95的置信区间为
即
八(5)、设某校女生的身高服从正态分布,今从该校某班中随机抽取9名女生,测得数据经计算如下:。求该校女生身高方差的置信度为0.95的置信区间。
解:因为学生身高服从正态分布,所以
的置信区间为:
的置信度0.95的置信区间为
即
八(6)、一批螺丝钉中,随机抽取9个,测得数据经计算如下:。设螺丝钉的长度服从正态分布,试求该批螺丝钉长度方差的置信度为0.95的置信区间。
解:因为螺丝钉的长度服从正态分布,所以
的置信区间为:
的置信度0.95的置信区间为
即
八(7)、从水平锻造机的一大批产品随机地抽取20件,测得其尺寸
的平均值,样本方差。假定该产品的尺寸X服从正态分布,其中与均未知。求的置信度为0.95的置信区间。
解:由于该产品的尺寸服从正态分布,所以
的置信区间为:
的置信度0.95的置信区间为
即
八(8)、已知某批铜丝的抗拉强度X服从正态分布。从中随机抽取9根,经计算得其标准差为8.069。求的置信度为0.95的置信区间。
()
解:由于抗拉强度服从正态分布所以,
的置信区间为:
的置信度为0.95的置信区间为
,即
八(9)、设总体X
~,从中抽取容量为16的一个样本,样本方差,试求总体方差的置信度为0.95的置信区间。
解:由于
X~,所以
的置信区间为:
的置信度0.95的置信区间为
,即
八(10)、某岩石密度的测量误差X服从正态分布,取样本观测值16个,得样本方差,试求的置信度为95%的置信区间。
解:由于
X
~
,所以
的置信区间为:
的置信度0.95的置信区间为:
即
拒绝域问题
九(1)、某厂生产铜丝,生产一向稳定,现从其产品中随机抽取10段检查其折断力,测得。假定铜丝的折断力服从正态分布,问在显著水平下,是否可以相信该厂生产的铜丝折断力的方差为16?
解:待检验的假设是
选择统计量
在成立时
取拒绝域w
={}
由样本数据知
接受,即可相信这批铜丝折断力的方差为16。
九(2)、已知某炼铁厂在生产正常的情况下,铁水含碳量X服从正态分布,其方差为0.03。在某段时间抽测了10炉铁水,测得铁水含碳量的样本方差为0.0375。试问在显著水平下,这段时间生产的铁水含碳量方差与正常情况下的方差有无显著差异?
解:待检验的假设是
选择统计量
在成立时
取拒绝域w
={}
由样本数据知
接受,即可相信这批铁水的含碳量与正常情况下的方差无显著差异。
九(3)、某厂加工一种零件,已知在正常的情况其长度服从正态分布,现从一批产品中抽测20个样本,测得样本标准差S=1.2。问在显著水平下,该批产品的标准差是否有显著差异?
解:待检验的假设是
选择统计量
在成立时
取拒绝域w
={}
由样本数据知
拒绝,即认为这批产品的标准差有显著差异。
九(4)、已知某炼铁厂在生产正常的情况下,铁水含碳量X服从正态分布。现抽测了9炉铁水,算得铁水含碳量的平均值,若总体方差没有显著差异,即,问在显著性水平下,总体均值有无显著差异?
解:待检验的假设是
选择统计量
在成立时
取拒绝域w={}
由样本数据知
拒绝,即认为总体均值有显著差异。
九(5)、已知某味精厂袋装味精的重量X
~,其中=15,,技术革新后,改用新机器包装。抽查9个样品,测定重量为(单位:克)
14.7
15.1
14.8
15.0
15.3
14.9
15.2
14.6
15.1
已知方差不变。问在显著性水平下,新机器包装的平均重量是否仍为15?
解:待检验的假设是
选择统计量
在成立时
取拒绝域w={}
经计算
接受,即可以认为袋装的平均重量仍为15克。
九(6)、某手表厂生产的男表表壳在正常情况下,其直径(单位:mm)服从正态分布N(20,1)。在某天的生产过程中,随机抽查4只表壳,测得直径分别为:
19.5
19.8
20.0
20.5.
问在显著性水平下,这天生产的表壳的均值是否正常?
解:
待检验的假设为
选择统计量
当成立时,
U~
取拒绝域w={}
经计算
接受,即认为表壳的均值正常。
九(7)、某切割机在正常工作时,切割得每段金属棒长服从正态分布,且其平均长度为10.5cm,标准差为0.15cm。今从一批产品中随机抽取16段进行测量,计算平均长度为=10.48cm。假设方差不变,问在显著性水平下,该切割机工作是否正常?
解:
待检验的假设为
选择统计量
当成立时,
U~
取拒绝域w={}
由已知
接受,即认为切割机工作正常。
九(8)、某厂生产某种零件,在正常生产的条件下,这种零件的周长服从正态分布,均值为0.13厘米。如果从某日生产的这种零件中任取9件测量后得=0.146厘米,S
=0.016厘米。问该日生产的零件的平均轴长是否与往日一样?
(
)
解:
待检验的假设为
选择统计量
当成立时,
T~t(8)
取拒绝域w={}
由已知
拒绝,即认为该生产的零件的平均轴长与往日有显著差异。
九、某灯泡厂生产的灯泡平均寿命是1120小时,现从一批新生产的灯泡中抽取9个样本,测得其平均寿命为1070小时,样本标准差小时。问在显著性水平下,检测灯泡的平均寿命有无显著变化?
解:
待检验的假设为
选择统计量
当成立时,
T~t(8)
取拒绝域w={}
由已知
接受,即认为检测灯泡的平均寿命无显著变化。
九、正常人的脉搏平均为72次/分,今对某种疾病患者9人,测得其脉搏为(次/分):
68
65
77
70
64
69
72
62
71
设患者的脉搏次数X服从正态分布,经计算得其标准差为4.583。试在显著水平=0.05下,检测患者的脉搏与正常人的脉搏有无显著差异?
解:
待检验的假设为
选择统计量
当成立时,
T
~
取拒绝域w={}
经计算
接受,检测者的脉搏与正常的脉搏无显著差异。