《统计学报告》word版 本文关键词:统计学,报告,word
《统计学报告》word版 本文简介:统计学课程(课内实验报告)系部名称:学生姓名:专业名称:班级:统计学课程实验报告一、实验目的能够使学生在学习统计学原理课程时,掌握统计学中的计算过程,理论联系实际。由于Excel是目前办公软件中比较流行的软件,因此,本试验课以该软件为基础,实现它的统计计算功能。通过该试验课程的学习,使每个学生能够达
《统计学报告》word版 本文内容:
统计学课程
(课内实验报告)
系部名称
:
学生姓名
:
专业名称
:
班
级
:
统计学课程实验报告
一、实验目的
能够使学生在学习统计学原理课程时,掌握统计学中的计算过程,理论联系实际。由于Excel是目前办公软件中比较流行的软件,因此,本试验课以该软件为基础,实现它的统计计算功能。通过该试验课程的学习,使每个学生能够达到能够利用该软件的统计计算功能熟练地完成教材中有关例题、习题的计算,并通过案例的学习,培养学生一定的解决实际问题的能力。
二、参考书目
1、统计学
贾俊平
中国人民大学出版社
2、EXCEL统计分析与决策
于洪彦
高等教育出版社
三、实验任务、内容及结果
实验一
根据下面的数据。
1.1用Excel制作一张组距式次数分布表,并绘制一张条形图(或柱状图),反映工人加工零件的人数分布情况。
从某企业中按随即抽样的原则抽出50名工人,以了解该企业工人生产状况(日加工零件数):
117
108
110
112
137
122
131
118
134
114
124
125
123
127
120
129
117
126
123
128
139
122
133
119
124
107
133
134
113
115
117
126
127
120
139
130
122
123
123
128
122
118
118
127
124
125
108
112
135
109
1.2整理成频数分布表,并绘制图形。
1.3
假设日加工零件数大于等于130为优秀。
一、实验步骤
第一步
建立如图1.1所示的Excel数据文件,或打开已有的数据文件。
图1.1
第二步
整理成频数分布表,如图1.2
某车间50名工人日加工零件数分组表
按零件数分组(个)
频数
频率
累计频数
累计频率
向上累计
向下累计
向上累计
向下累计
105-110
4
8
4
50
8
100
110-115
5
10
9
46
18
92
115-120
8
16
17
41
34
82
120-125
13
26
30
33
60
66
125-130
10
20
40
20
80
40
130-135
6
12
46
10
92
20
135-140
4
8
50
4
100
8
合计
50
100
图1.2
第三步
绘制直方图
1.
选择“数据”的“数据分析”,在选择“直方图”选项,弹出对话框如图1.3。
图1.3
2.输入输入区域、接收区域和输出区域,选择累计百分率和图表输出。按确定,如图
图1.4
3.输出图,对图形的标题、图例、数据标志、坐标轴、等进行设置。如图1.5和1.6。
图1.5
图1.6
第四步
频数分布表
图1.7
第五步
假设日加工零件数大于等于130为优秀。如图1.8。
图1.8
实验二
百货公司6月份各天的销售额数据如下(单位:万元)
257
276
297
252
238
310
240
236
265
278
271
292
261
281
301
274
267
280
291
258
272
284
268
303
273
263
322
249
269
295
(1)计算该百货公司日销售额的均值、众数、中位数;
(2)计算该百货公司日销售额的极差、标准差;
(3)计算日销售额分布的偏态系数和峰度系数。
实验步骤
第一步
输入原始数据,如图2.1。
图2.1
第二步
选择“数据”的“数据分析”,再选择“描述统计”。如图2.2
图2.2
第三步
输入输入区域和输出区域,选择汇总统计、平均数置信度、第K大值和第K小值。如图2.3。
图
2.3
第四步
输出结果,如图2.4。
图2.4
实验三
综合运用统计学中相关与回归分析的内容,根据下列数据作出一个相关回归模型。
某地区1996~2011年国民生产总值和财政收入资料
单位:亿元
年份
国内生产总值
财政收入
1996
18667.82
2937.1
1997
21781.5
3149.48
1998
26923.48
3483.37
1999
35333.92
4348.95
2000
48197.86
5218.1
2001
60793.73
6242.2
2002
71176.59
7407.99
2003
78973.04
8651.14
2004
84402.28
9875.95
2005
89677.05
11444.08
2006
99214.55
13395.23
2007
109655.2
16386.04
2008
120332.7
18903.64
2009
135822.8
21715.25
2010
159878.3
26396.47
2011
183084.8
31649.29
实验步骤:
一、利用Excel做相关分析
相关分析通常有两种方式,一个是绘制数据散点图,另一个是计算相关系数。
1.绘制数据散点图(XY散点图)
第一步
建立或打开如图3.1所示的Excel数据表。
图3.1
第二步
单击【插入】按钮,启动【散点图】,进入【所有图表类型】,选取XY散点图。如图3.2所示。
图3.2
第三步选【布局】,进入【标签】,设置标题、坐标轴、图例等项目,如图3.3所示。
图3.3
2.计算相关系数
用Excel计算相关系数,即可用“数据分析”工具完成,也可调用CORREL(
)函数完成。其中用“数据分析”工具简单快捷。故这里只介绍用“数据分析”工具计算相关系数的过程。
第一步
建立或打开如图3.4所示的Excel数据表。
图3.4
第二步
依次选【数据】、【数据分析】、【相关系数】、【确定】,进入相关系数对话框,如图3.5所示。
图3.5
第三步
选定输入输出区域。其中输入区域为分析变量X、Y所在区域,本例的输入区域为:B1:C13;输出区域为放置计算结果的区域。
第四步
选【确定】,得到如图3.6所示的结果。
图3.6
图为国内生产总值与财政收入的相关矩阵,其中国内生产总值与财政收入的相关系数为0.981137。
二、回归分析
当两个变量间存在相关时,即可进行回归分析。在Excel进行回归分析,可由三种方法分别介绍如下:
1.绘图中加入趋势线
在绘图中加入趋势线确定回归方程,时回归分析最简便的方式。而且可计算的回归种类也最多,包括直线、多项式曲线、指数曲线、对数曲线等。
设在Excel工作表中建立国内生产总值与财政收入的关系如图5.1所示。下面以此为例分析不同形式的回归模型。
2.插入回归线(趋势线)
第一步
在图上的数据点按右键,选【添加趋势线】。
第二步
点【添加趋势线】,选【线性】回归线,对话框【选项】选项卡,勾选【显示公式】及【显示R平方值】,如图3.7所示.
图3.7
第三步
单击【确定】,可看到图上已出现较粗的预测线、回归方程及R平方值,将此【数据标志格式】按右键修改其字号,选【不透明】,将方框来小一点,最后如图3.8所示.
图3.8
其回归方程为:
y
=
0.175x
-
2813
即财政收入=0.175×国内生产总值-2813
可决系数为0.962,表示整个回归方程的解释能力不错.
三、预测:
取得了回归方程以后,即可用来预测不同价格的销量.用Excel完成回归预测的步骤为:
第一步
在B19输入要计算的国内生产总值
第二步
选点图上的回归方程式,会变成用方框包围,如图3.9所示。
图3.9
第三步
再一次选择点击回归方程式的内容,可进入编辑状态,方程式的外围方框消失。
第四步
用拖拽的方式,选定回归方程式的内容,如图3.10所示
第五步
单击【复制】按钮,复制回归方程式的内容
第六步
移动鼠标到C19,点击其数据编辑区的“=”按钮,进入公式编辑状态
第七步
单击【粘贴】按钮,将复制的回归方程式内容贴进来
第八步
删除编辑区方程式前面的“y=”将x改为*B19,使其变成:
=
0.175*B19-2813,如图5.11所示.
图3.10
第九步
单击【确定】按钮,即可计算出国内生产总值为203085.7时,财政收入为32726.9975,如图3.11所示.
图3.11
注意:以上线性回归分析过程完全适用于曲线回归分析,只是在添加趋势线时,选择与分析相关的曲线趋势类型即可,如要进行指数回归分析,则按如图5.13所示的情况选择趋势类型.
为节省篇幅,不在赘述.
(图5.13)
四、使用“数据分析”进行回归分析
在绘图中,利用添加趋势线确定回归方程式,并无法对方程式及其系数进行检验,而且很多统计数字也难提供.
如果使用“数据分析工具”的“回归”项进行计算(得先安装“加载宏”的“分析工具库”)则可获得很多的统计数字.如相关系数、判定系数、F统计量、t统计量等.
直线回归
1.建立或打开Excel数据文件,如图5.14所示.
(图5.14)
2.单击【数据】、【数据分析】,选【回归】,确定后进入回归对话框如图5.15所示.
(图5.15)
3.在“Y值输入区域”处,以拖拽的方式选取销售量区域C2:C17区域.
4.在“X值输入区域”处,以拖拽的方式选取居民人均收入区域B2:B17区域.
5.由于上述两区域均含标志(变量名),所以勾选“标志(L)”.
6.勾选“置信度(O)”,可计算回归系数的置信区间(本例设置为95.45%).
7.在“输出选项”出确定将回归结果方在何处?,本例为原工作表的B22位置.
8.如果要分析残差,可勾选“残差(R)”或“标准残差(T)”(本例选前者)
9.如果要绘图,可勾选“残差图(D)”或“线性拟合图(I)”(本例选后者)
(图5.16)
10.单击【确定】按钮,即可获得回归结果.因其内容较多,将其拆分为几个部分进行说明.所示.
(图5.17)
此部分为中:
l
“Multiple
R”为相关系数,其中两变量相关为单相关系数,多变量相关为复相关系数中;
l
“R
Square”为可决系数或判定系数;
l
“Adjusted
R
Square”为校正的可决系数,主要用于多元回归拟合优度的判别;
l
“标准误差”为
(图5.18)
此部分通过方差分析,计算F统计量,并检验因变量(Y)与自变量(X,在多元回归中则为全部的自变量)间,是否存在显着的回归关系?判断是否显着,只需看显着性水平是否小于所指定的а值即可,如本例的显着性水平0.00077а=0.05,所以无法放弃其为0的假设,回归方长的常数项应为0,所以预测时可将其省略.
另外本例的自变量(国内生产总值)的回归系数为0.181,其t统计量为19.374,显着性水平(P-值)0.000769<а=0.05,所以放弃其为0的假设,回归方程中的自变量X的回归系数不为0,自变量与因变量之间存在显着的线性相关.
所以,预测时可以只取:
y=0.181x
作为回归方程式.但Excel仍用:
y=192.526+0.181x
进行后续的残差分析
(图5.20)
此部分是将各观察值的X(国内生产总值)代入方程所得的预测值,以及预测与实际值之间的误差.
图5.21
此部分为样本回归线图,以图平面绘出实际观察值与预测值的分布状况.由于无法画出多元空间的图形,当自变量为多个时,将分为多个平面图分别显示.
注意:使用“数据分析”也可完成多元线性回归,其过程和回归分析结果与一元线性回归
完全一致的,只是在“X值的输入区域”的选定上略有差别,由于多元回归中有多两个以上的自变量,所以,在选定“X值的输入区域”应包括所有自变量的分布区域.
此外,还可以用直线回归LINEST(
)、预测FORECAST(
)等函数进行回归分析与预测,以上函数的调用过程与其它函数类似.由于篇幅所限,就不再赘述.
四、实验地点
院机房
五、实验总结
这次实验让我学会了运用Excel软件对统计数据进行分析整理,例如描述统计,绘制直方图,建立回归分析模型。通过这次实验我掌握了很多应用软件方面的知识,真正的做到了学习与实践相结合,加深知识的掌握的同时也锻炼了操作能力。更加加深了我对统计学这一学科的学习和理解,为我在以后的学习奠定了基础。