中南财经政法大学计量经济学复习总结 本文关键词:计量,经济学,复习,中南财经政法大学
中南财经政法大学计量经济学复习总结 本文简介:第1章导论1.经济计量学的概念及其认识概念:计量经济学是以经济理论为前提,以经济数据为基础,运用数学和统计学的方法,通过建立经济计量模型来研究带有随机影响的社会经济现象的数量关系和规律的一门经济学科。研究对象—经济现象研究目的—揭示经济关系与经济活动数量规律核心内容—建立和应用经济计量模型计量经济学
中南财经政法大学计量经济学复习总结 本文内容:
第1章
导
论
1.
经济计量学的概念及其认识
概念:计量经济学是以经济理论为前提,以经济数据为基础,运用数学和统计学的方法,通过建立经济计量模型来研究带有随机影响的社会经济现象的数量关系和规律的一门经济学科。
研究对象—经济现象
研究目的—揭示经济关系与经济活动数量规律
核心内容—建立和应用经济计量模型
计量经济学是经济理论、统计学、数学三者的结合
2.
了解计量经济学的内容体系
理论计量经济学:主要是寻找适当的方法,来测度由经济计量模型设定的经济关系式。
应用计量经济学:以经济理论和事实为出发点,应用计量方法,解决经济系统运行过程中的理论问题或实践问题。
3.
掌握经济计量分析工作的四个步骤
a.
建立模型
?模型方程的种类
随机方程,是根据经济行为构造的函数关系式,也常称它们为“行为方程”。
非随机方程,是根据经济学理论或政策、法规而构造的经济变量恒等式,也常称它们“定义方程”、“制度方程”或“政策方程”。
?变量的种类:
从变量的性质区分:内生变量—其数值由模型所决定的变量,是模型求解的结果
外生变量—其数值由模型以外决定的变量(相关概念:滞后内生变量、前定变量)
经济变量:内生变量
前定变量:滞后变量
外生变量——外生经济变量
政策变量
虚拟变量
从变量的因果关系区分:被解释变量(因变量)——要分析研究的变量
解释变量(自变量)——说明因变量变动主要原因的变量(非主要原因归入随机误差项)
b.估计参数
参数估计的过程:收集模型所含经济变量的数据;方程识别条件的研究;解释变量间的相关程度,即多重共性的研究;选择适当的经济计量方法估计模型参数
模型中数据的类型:
?时间序列数据,是指某一经济变量在各个时期的数值按时间先后顺序排列所形成的数列。例如1980—2012年间每年国民收入的数据构成这个变量的时间序列。
?截面数据,是指在同一时点或时期上,不同统计单位的相同统计指标组成的数据。如2012年我国各省市人口数、企业数等。
?混合数据,是指兼有时间序列和截面数据两种成份的数据。
④虚拟变量数据,是经济计量学家为不能量化的定性变量而设定的。例如职业、性别、宗教信仰都是影响面包、猪肉、化妆品等特定商品消费量的因素。这类具有质量属性的因素,可在方程中引进虚拟变量来近似反映其影响。虚拟变量的取值可为1或0。
c.验证模型
验证模型的三种准则:经济理论准则——所估计的模型与经济理论是否相符
统计准则——检验参数估计值是否是抽样的偶然结果
经济计量准则——是否符合计量经济方法的基本假定
d.使用模型
经济计量模型的主要用途:结构分析——分析变量之间的数量比例关系(如:边际分析、弹性分析、乘数分析、比较静力分析),例:分析消费增加对GDP的拉动作用
经济预测——由预先测定的解释变量去预测应变量在样本以外的数据,例:预测股票市场价格的走势
规划政策——用模型对各种可供选择的政策方案的实施后果进行模拟测算,从而对各种政策方案作出评价,例:分析道路收费政策对汽车市场的影响
第
二
章
一元线性回归模型
1.
回归分析的概念
研究被解释变量对解释变量的依赖关系,其目的是由给定的解释变量去估计被解释变量的总体均值
几个概念:
Y的条件分布——当解释变量Y
取某固定值时(条件),Y的值不确定,Y的不同取值形成一定的分布,即Y的条件分布。
Y的条件期望——对于Y的每一个取值,对Y所形成的分布确定其期望或均值,称为Y的条件期望或条件均值
回归线——对于每个X的取值,都有Y的条件期望与值对应,代表这些Y的条件期望的点的轨迹所形成的的直线或曲线,成为回归线。
回归函数:应变量Y的条件期望随解释变量X的变化而有规律的变化,如果把Y的条件期望
表示为X的某种函数
这个函数称为回归函数。
2.一元线性回归模型
回归函数分为:总体回归函数(PRF)和样本回归函数(SRF)
a.
总体回归函数的表现形式
均值形式:假如Y的条件均值是解释变量X的线性函数,可表示为(式2.2)
随机形式(个别值形式):对于一定的,Y的个别值分布在的周围,若令各个与条件均值差为,显然是随机变量,则有或(式2.4)
随机误差项:为随机或非系统性成分,代表所有可能影响Y,但又未能包括到回归模型中来的被忽略变量的代理变量。
有效估计量:在所有线性无偏估计量中具有最小方差的无偏估计量。
b.样本回归函数的表现形式
均值形式:样本回归函数如果是线性函数,可表示为(式2.5),,
随机形式:
3.
最小二乘估计
普通最小二乘法(OLS)基本思想:
不同的估计方法可得到不同的样本回归系数和,所估计的也不同。
理想的估计方法应使与的差即剩余项越小越好
因可正可负,所以可以取最小
总体线性回归的经典假定
(1)对随机扰动项u的假定
假定1:零均值假定——
在给定的条件下,的条件期望为零
假定2:同方差假定——在给定的条件下,的条件方差为某个常数
假定3:无自相关假定——
随机扰动项的各次观测值互不相关
假定4:随机扰动与解释变量不相关
假定5:对随机扰动项分布的正态性假定——即假定服从均值为零、方差为的正态分布
(2)
对模型和变量的假定
假定6:正确地设定了回归模型,即模型没有设定偏误
假定7:解释变量X是非随机的
假定8:对于多元回归模型,解释变量之间无完全的多重共线性。
高斯-马儿可夫定理(G-M定理):在给定经典线性回归模型的假定下,最小二乘估计量是最佳线性无偏估计量。
判定系数():
定义:解释平方和(ESS)在总平方和(TSS)中所占的比重称为判定系数(或可决系数)
总变差(TSS):应变量Y的观测值与其平均值的离差平方和(总平方和)
解释了的变差(ESS):应变量Y的估计值与其平均值的离差平方和(解释平方和)
剩余平方和(RSS):应变量观测值与估计值之差的平方和(残差平方和)
含义:对回归线拟合优度的度量
4.
掌握回归系数显著性检验——t检验方法
?假设:一般地,可假设为
原假设H0:
备择假设H1:
例:在回归分析中,如果事先我们已有一些研究成果认定边际消费倾向
为0.9,那么
=0.9这一声称的假设为虚拟假设,用H0表示,与之相对应的≠0.9称为备择假设,用H1表示
T检验:已知,即t服从自由度为n-2的t分布。如原假设Ho成立,即,则
?若X对Y的影响不显著,则有=0,因此,通常设定的假设
(时,)
例:研究住房租金水平是否受到一个大学城里学生人数的影响。令rent为一个大学城里住房的单位面积的平均月租金,pop表示城市总人口,avginc
表示城市人均收入,pctstu
表示学生人数占总人口数的百分比。使用的模型为
要求:
1.
表述虚拟假设:在其它条件不变的情况下,相对于总人口,学生人数的多少对月租金没有显著影响;表述有显著影响的对立假设。
原假设Ho:=0
备择假设H1:≠0
2.
你预期和具有什么样的符号?
3.
利用64个大学城1990年的数据得到估计方程为
“总人口增加10%将导致月租金提高约6.6%”,这个说法有什么不妥?
不妥,总人口增加10%将导致月租金提高约0.66%(0.066*0.1*100%=0.66%)
4.
在5%的显著性水平下检验各偏回归系数的显著性。
T检验
且当样本容量较大(n≥30),t大于2.0,回归系数即判定为显著
城市总人口:t=0.066/0.033=2
显著
城市人均收入:t=0.507/0.081=6.259
显著
学生人数:t=0.005/0.0017=2.941
显著
5.
掌握回归分析结果的报告与评价
报告:回归分析的结果,应该以清晰的格式予以表达,通常采用如下格式
Se
=
(52.9184)
(0.0149)
t
=
(3.0212)
(51.1354)
P
=
(0.0165)
(0.0000)
R2
=
0.9970
=
67.6376
评价:
(
1)经济理论评价。根据经济理论,边际消费倾向应为小于1大于0的正数。在收入-消费模型中,我们得到的边际消费倾向为0.7616,与经济理论的描述是一致的。
(2)
统计上的显著性。必须对回归系数进行显著性检验,判断回归系数的显著性。
(3)
回归分析模型的拟合优度,即解释变量X在多大程度上解释了被解释变量Y的变异
(4)
检验回归分析模型是否满足经典假定。
6.
了解回归分析的应用——预测:对事物未来状态的估计
第三章
多元线性回归模型
1.多元总体回归模型的经典假定
假定1:零均值假定,即
E()=0
假定2:同方差假定
假定3:
无序列相关假定
假定4:
与每一个解释变量无关
假定5:无设定偏误
假定6:解释变量X
之间无完全共线性
2.最小二乘估计
调整的判定系数:为了消除解释变量个数对判定系数的影响,需使用调整后的判定系数
式中,k
为包括截距项在内的模型中的参数个数。在二元回归模型中k=3,在一元回归模型中k=2。所谓调整,就是指的计算式中的和都用它们的自由度(n-k)和(n-1)去除。
OLS估计量的期望:偏回归系数的期望值
在多元回归模型满足经典假定的条件下,普通最小二乘估计量是总体参数的无偏估计。即:j=1,2,…,k
在多元回归分析中,如果回归模型的函数形式设定有误或遗漏了与包含在模型中的变量相关的重要解释变量,都会导致经典假定E(ui)=0不成立,即E(ui)≠0。如此,则使得最小二乘估计量不是总体参数的无偏估计,即。
回归标准误的估计:由于干扰项不可观测,因此必须据样本结果估计。的无偏估计量为
且
其中正的平方根被称为回归标准误。
G-M定理及意义:
定义:在多元线性回归模型的经典假定下,普通最小二乘估计量分别是的最佳线性无偏估计量。即普通最小而成估计量,是所有线性无偏估计量中方差最小的。
意义:当经典假定成立时,我们不需要再去寻找其它无偏估计量,没有一个会优于普通最小二乘估计量。也就是说,如果存在一个好的线性无偏估计量,这个估计量的方差最多与普通最小二乘估计量的方差一样小,不会小于普通最小二乘估计量的方差。
3.
多元回归模型的检验
回归系数的显著性检验—t检验(多元回归中的t
检验决策规则与一元回归相同)
总体回归模型:
在服从正态分布及经典假定条件下,
(决策规则:假设;计算原假设下t的统计量;给定显著水平α下,查t分布表临界值;判断拒绝或接受原假设)
回归模型的整体性检验—F检验
多元回归模型的总体显著性就是对原假设进行检验。检验的目的就是判断被解释变量Y
是否与X2,X3,…,Xk
在整体上有线性关系。
即
F
统计量与判定系数R2
的关系如下:
(决策规则:设定假设;计算F统计量;在给定显著水平α下,查找分布表得临界值;判断接受或拒绝原假设)
4.
回归模型的函数形式
对数系数的经济含义,对线性模型的优点
在进行某商品的市场需求分析时,我们知道价格是影响需求量的重要因素,我们设定如下模型
,(Yi
=需求量,Xi
=价格)
取对数可得:
令,则
令
则
优点:(1)斜率系数度量了Y对X的弹性,也就是当解释变量X变化1%时,Y的变化百分比。
(2)斜率系数与变量X,Y的测量单位无关。
(3)当Y
>
0时,使用对数形式LnY比使用水平值Y作为被解释变量的模型更接近经典线性模型。
(4)取对数后会缩小变量的取值范围,使得估计值对被解释变量或解释变量的异常值不会很敏感。
半对数线性模型系数的经济含义,对线性模型的优点
(一)对数到线性模型
在经济系统中,
人们用GDP、失业、进出口、投资、人口等指标的增长率来描述经济系统的发展状态。对数—线性模型为我们提供了方便,该类对数—线性模型为,Yt
=要研究的经济现象,t=时间变量。式中,被解释变量为对数形式,解释变量为线性形式,称为对数到线性的半对数模型。
斜率系数的含义为:解释变量X绝对量改变一个单位时,被解释变量Y
的相对改变量。即
(2)
线性到对数模型
类似于对数到线性的半对数模型,如果我们想测度解释变量的相对改变量对被解释变量的绝对改变量的影响,我们就需要使用解释变量是对数形式,被解释变量是线性形式的回归模型。
倒数模型(双曲线模型)的三种形式
(1)
图①可用来描述平均总成本曲线,单位固定成本随着产量X的增加而下降。
(2)
图②可用来描述宏观经济学中著名的菲利普斯曲线(Phillips
curve)。在工资变化率Y
随失业率X
的变化中,存在两个明显不同的阶段。
(3)
③可用来描述恩格尔支出曲线。如令Y
为对某一商品的支出,X
为收入,则某些商品具有如下特性:(1)收入上存在一个临界水平。(2)消费上有一饱和水平。
第4章
违反经典假定的回归模型
1.
异方差的概念、原因、后果、检验及修正方法(WLS)
(一)概念
在线性模型的基本假定中,关于方差不变的假定不成立,其他假定不变的情形称为异方差性。
(二)原因
引起异方差的原因还有很多,如模型中省略了重要的解释变量,模型的函数形式设定不准确等都容易产生异方差。一般情况下样本数据为截面数据时容易产生异方差性。
(3)
后果
[1].参数估计量虽是无偏的,但不是最小方差线性无偏估计
[2].参数的显著性检验失效
[3]回归方程的应用效果极不理想,或者说模型的预测失效。
(4)
检验
1)
残差图分析法:以残差为纵坐标,以其他适宜的变量为横坐标画散点图。
常用的横坐标有三种选择:
以为横坐标,i=1,2,.,n;比拟合优度为横坐标;以观测时间或序号为横坐标
一般情况下,当回归模型满足所有假定时,以为纵坐标的残差图上的n
个点散布应是随机的、无任何规律。残差有一定趋势则表示回归模型有一定的异方差性。
二)等级相关系数法
又称斯皮尔曼(Spearman)检验,既适用于大样本,也适用于小样本。将异方差性同误差项和某个解释变量之间的相关程度联系起来,从而将对异方差性的研究转化为对它们之间相关程度的研究。
三个步骤:第一步,作Y
关于X
的普通最小二乘估计,求出的估计值,即
的值。
第二步,取的绝对值,即,把和按递增或递减的次序划分等级。算出等级相关系数
第三步,做等级相关系数的显著性检验。
若Xi
和之间存在系统关系,则说明模型中存在异方差。在多元的情况下,需对每一个解释变量做等级相关系数检验。只有当每个解释变量检验都不存在异方差时模型中才不存在异方差。否则,模型中存在异方差。
3)
戈里瑟(Glejser)检验
用残差绝对值对每个解释变量建立各种回归模型,并检验回归系数是否为0。如果,则有异方差。
这种方法不仅能检验出模型中存在的异方差,而且把异方差的表现形式找出来便于后面改进时使用。
4)
怀特(White)检验
用残差平方对所有解释变量及其平方项和交叉乘积项进行线性回归,并检验各回归系数是否全部为0。
对于两个解释变量的回归模型,怀特检验步骤如下:
第一步,使用普通最小二乘法估计模型,,并获得残差
第二步,辅助回归,将残差ei
的平方对所有的解释变量及解释变量的平方与交叉积回归,求这个辅助回归的判定系数
第三步,在无异方差的原假设下,可以证明,辅助回归的乘以样本容量n,渐近地服从自由度为辅助回归中解释变量个数
r(不包括常数项)的分布
第四步,如果n*≥选定显著水平临界值,则有异方差
5)
戈德菲尔德-匡特(Goldfeld-Quandt)检验(样本分段比检验)
首先将样本按某个解释变量的大小顺序排列,并将样本从中间截成两段;然后各段分别用普通最小二乘法拟合回归模型,并分别计算各段的残差平方和。
(5)
修正方法:寻求适当的补救方法,对原来的模型进行变换,使变换后的模型满足同方差性假定,然后进行模型参数的估计,就可得到理想的回归模型。
加权最小二乘法(WLS):一元回归模型
?已知时,如果每个观察值的误差项方差是已知的,使用为权数,对模型做变换,即可
通过加权变换使原模型中的异方差误差项转换为同方差误差项,使加权变换后的模型满足最小二乘法的假定,从而使用普通最小二乘法估计参数,这种方法称为加权最小二乘法。
?未知时,一般情况下,我们可根据误差与解释变量或被解释变量的关系来确定变换的权数。一般我们先采用戈里瑟检验方法确定ei
与Xi
之间的关系。
如之间为线性关系,对模型两边同时乘以,将异方差模型变为同方差模型。
如之间为线性关系,选择1/Xi为权数,将异方差模型变为同方差模型。
2.
自相关的概念、原因、后果、检验(DW检验)及补救方法
(一)概念:如果一个回归模型,则我们称随机误差项之间存在着自相关现象(或者说不同时点的误差项之间存在相关),也称为序列相关。随机误差项一般会出现自相关的情形。
(二)原因
遗漏了重要的解释变量;经济变量的滞后性;回归函数形式的设定错误也可能引起序列相关;蛛网现象(Cobweb
Phenomenon);对原始数据加工整理
(3)
后果(与异方差类似)
参数的估计量是无偏的,但不是有效的;可能严重低估误差项的方差;常用的F
检验和t
检验失效;如果不加处理地运用普通最小二乘法估计模型参数,回归参数的置信区间和利用回归模型进行预测的结果会存在较大的误差
(4)
检验
一)图示检验法
图示法是一种直观的诊断方法,它是把给定的回归模型直接用普通最小二乘法估计参数,求出残差项et,et作为ut随机项的真实估计值,再描绘et
的散点图,根据散点图来判断et的相关性。
二)自相关系数法
自相关系数的取值范围是[-1,1],当接近于1时,表明误差序列存在正相关,当接近于-1时,表明误差序列存在负相关。
3)
DW检验
J.Durbin(杜宾)和G.S.Watson
(沃特森)于1951年提出的一种适用于小样本的检验方法。DW检验只能用于检验随机误差项具有一阶自回归形式的序列相关问题。
缺点和局限性:DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断;
DW统计量的上、下界表要求n≥15,这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断;
DW检验不适应随机误差项具有高阶序列相关的检验;
只适用于有常数项的回归模型且解释变量中不能含滞后的被解释变量,并且解释变量是非随机的,数据中无缺失项
4)
LM检验
即拉格朗日乘数检验,也可用于检验回归方程的残差序列是否存在高阶自相关,而且在方程中存在滞后因变量的情况下,LM检验仍然有效,由Breusch和Godfrey
于1978年提出,也称BG(GB)检验
(5)
补救措施
一)差分法——是将原模型变换为差分模型,分为一阶差分法和广义差分法。
二)广义最小二乘法(GLS)——最具有普遍意义的最小二乘法。其中普通最小二乘法和加权最小二乘法是它的特例。
3.多重共线性的概念、原因、后果、检验及补救措施
(一)概念
多元线性回归模型有一个经典假定,就是要求多元线性回归模型中的解释变量X之间无完全的共线性。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。分完全共线性和近似共线性。
(二)原因
经济变量相关的共同趋势;模型中包含的滞后变量;样本资料的限制;利用截面数据建立模型也可能出现多重共线性。
(3)
后果
严重多重共线性情形的后果:多重共线性不改变参数估计量的无偏性
多重共线性使参数最小二乘估计量的方差变大,即估计值的精度降低
各个回归系数的值很难精确估计,甚至可能出现符号错误的现象
回归系数对样本数据的微小变化变得非常敏感
(4)
检验
一)方差膨胀(扩大)因子法VIF
的大小反映了解释变量之间是否存在多重共线性,经验表明,当≥10时,就说明解释变量Xj
与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计值。
二)直观判定法
有些解释变量的回归系数所带符号与定性分析结果违背时,可能存在多重共线性问题;一些重要的解释变量在回归方程中没有通过显著性检验时,可初步判断存在着严重的多重共线性;解释变量间的相关系数较大时,可能会出现多重共线性问题;当增加或剔除一个解释变量,或者改变一个观测值时,回归系数的估计值发生较大变化,我们就认为回归方程存在严重的多重共线性;对于采用时间序列数据做样本,以多元线性形式建立的计量经济模型,往往存在多重共线性。
三)特征根判别法
特征根分析——当矩阵X’X至少有一个特征根近似为零时,X的列向量间必存在严重多重共线性。
四)逐步回归检验法
将变量逐个的引入模型,每引入一个解释变量后,都要进行F检验,并对已经选入的解释变量逐个进行
t
检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除,以确保每次引入新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入时会被剔除,因而也是一种检测多重共线性的有效方法。
(5)
补救措施
一)使用非样本先验信息——如果据先前的经济计量分析或经济理论分析已知模型中的共线性解释变量的参数间具有某种线性关系,则可利用此条件消除解释变量间的多重共线性。
二)横截面与时间序列数据并用——
就是先利用横截面数据估计某一参数,将结果代入原方程后,再利用时间序列数据估计另一参数。
三)剔除一些不重要的共线性解释变量——当涉及解释变量较多时,大多数回归方程都受到多重共线性的影响。这时,最常用的办法是首先作解释变量的筛选,舍去一些解释变量。
四)增大样本容量——建立一个实际经济问题的回归模型,如果所收集的样本数据太少,也容易产生多重共线性。从本质上讲,多重共线性是样本现象。
五)逐步回归法——用被解释变量对每一个所考虑的解释变量做简单回归;以对被解释变量贡献最大的解释变量所对应的回归方程为基础,按对被解释变量贡献大小的顺序逐个引入其余的解释变量。
六)使用有偏估计——改进古典的最小二乘法,提出以采用有偏估计为代价来提高估计量稳定性的方法,如岭回归法、主成分法、偏最小二乘法等。
4.随机解释变量问题的三种情况、原因、后果及修正方法(IV)
如果存在一个或多个随机变量作为解释变量,则该模型称为随机解释变量问题。
(一)三种情况(假设为随机解释变量)
随机解释变量与随机误差项相互独立。即Cov(X2t,ut)=0
随机解释变量与随机误差项同期相关,即Cov(X2t,ut)≠0
随机解释变量与同期误差项无关但异期有关,即Cov(X2t,ut)=0
Cov(X2t,ut-s)≠0
(s≠0)
(二)原因
省略解释变量的影响——省略的解释变量同模型中某个解释变量相关易造成解释变量与解释误差项相关
滞后被解释变量做解释变量
联立方程模型中,如果一个变量在一个模型中作为被解释变量,而在另一个方程中作为解释变量,就使该变量成了随机解释变量。
数据测量误差
(3)
后果:取决于随机解释变量与随机误差项是否相关
如果随机解释变量与随机误差项相互独立,得到的参数估计量仍然是无偏的,且是一致估计量
如果随机解释变量与随机误差项同期不相关,但异期相关,得到的参数估计量有偏,但却是一致的
如果随机解释变量与随机误差项同期相关,得到的参数估计量有偏但非一致
(4)
修正方法
工具变量法(IV):在进行参数估计的过程中选择适当的工具变量,替代回归模型中随机误差项相关性的
变量。
IV估计量仍然是有偏的,但却是一致估计量
第五章
虚拟解释变量模型
1.虚拟解释变量的概念
给定某一质量变量某属性的出现为1,未出现为0,称这样的变量为虚拟变量。虚拟变量主要是用来代表质的因素,但是有些情况下也可以用来代表数量因素。例如在建立储蓄函数时,“收入”显然是一个重要解释变量,虽然是“数量”因素,但是为了方便也可以用虚拟变量表示。
2.虚拟变量的设定原则,注意虚拟变量陷阱
设定原则:如果只有一个质的因素,且具有m个特征,那么如果是含有截距项的,就要引入m-1个虚拟变量;不含有截距项的,
应该引入m个虚拟变量
虚拟变量陷阱:如果虚拟变量设定不当,会使最小二乘法失效,称这种情况为虚拟变量陷阱。在有截距项的情况下,如果一个质的因素有多少个特征就引入多少个虚拟变量是行不通的。
3.
虚拟变量引入方法
(1)
截距变动(加法模型)
一)包含一个虚拟变量的截距变动模型
假设只有一个质的因素影响被解释变量的变化,而且这个因素仅有两种特征,这时候在有截距项的回归模型中只需要引入一个虚拟变量。
例:用一个虚拟变量来表示这个质的因素,消费函数为
式中,Yi=第i个居民的消费水平,Xi=第i个居民的收入水平,Di为虚拟变量。我们用Di=1表示正常年份这一特征,用Di=0来表示非正常年份。
则
二者具有相同的斜率,但是截距不同。
2)
包含多个虚拟变量的截距变动模型
很多质的因素往往不只具有两个特征,例如全世界的国家可以分为发达国家、发展中国家、不发达国家。
例:模型,其中,Yt=季度的消费,Xt=季度的收入,对于四个季度,我们引入了三个虚拟变量:
则
四个季度的回归模型分别为
(2)
斜率变动(乘法模型)
在实际问题中,斜率单独变动出现的情形一般比较少,它指的是改变了变动的速率。
例:回归模型
其中,Yi=第
i
个家庭的消费水平,Xi=第
i
个家庭的收入水平
则
(三)截距和斜率同时变动(混合模型)
在多数情况下,质的因素不但对回归模型的截距有影响,而且还会改变模型的斜率。
例:模型,式中,Yi=第个家庭的消费水平,Xi=第个家庭的收入水平
则
β1和
β3
分别表示城镇居民家庭和农村居民家庭的消费函数在截距和斜率上的差异。
第6章
滞后变量模型
1.
分布滞后模型的概念及系数含义
滞后模型概念:在经济活动中,某一个经济变量的影响不仅取决于同期各种因素,而且也取决于过去时期的各种因素,有时还受自身过去值的影响。人们把这些过去时期的变量,称作滞后变量,把那些包括滞后变量作为解释变量的模型称作滞后变量模型。
分布滞后模型定义:如果一个回归模型不仅包含解释变量的现期值,而且还包含解释变量的滞后值,则这个回归模型就是分布滞后模型。它的一般形式为
有限分布滞后模型:滞后长度k为一个确定的数
无限分布滞后模型:没有规定最大滞后长度
系数含义:回归系数β0
称为短期(或即期)乘数,它表示解释变量X
变化一个单位对同期被解释变量Y产生的影响;β1,β2,…称为延期(或动态)乘数,它们度量解释变量X的各个前期值变动一个单位对被解释变量
Y
的滞后影响;所有乘数的和称为长期
(或总分布)乘数,表示X变动一个单位,由于滞后效应而形成的对Y总影响的大小。
2.
有限分布滞后模型估计存在困难
用OLS对分布滞后模型进行估计时存在的困难
产生多重共线问题
损失自由度问题
对于有限分布滞后模型,最大滞后期k较难确定
分布滞后模型中的随机误差项往往是严重自相关的
有限分布滞后模型估计的两种方法:
?经验加权法:指根据观察及经验为滞后变量的系数指定权数,使滞后变量按权数的线性组合,构成新的变量W,然后用最小二乘法估计参数。
步骤:根据经验确定滞后长度
;
确定的权数
;
利用第一组权数构造第一个新的序列;
应用最小二乘法求系数的估计值、,并对估计方程进行统计检验及经济计量检验,记下相应统计量的取值。
按同样的方法重新给定第二组、第三组等权数,并依次构造新的序列,建立新方程;
选优,根据最优权数就可以得到滞后变量对应系数的最优估计值。
?阿尔蒙多项式估计方法
基本思想:如果有限分布滞后模型中的参数的分布可以近似用一个关于i
的低阶多项式表示,就可以利用多项式减少模型中的参数。
依据:数学分析的维斯特拉斯定理,多项式可以逼近各种形式的函数。于是,阿尔蒙对模型中的系数用阶数适当的多项式去逼近。
优缺点:
优点——克服了自由度不足的问题;阿尔蒙变换具有充分的柔顺性;可以缓解多重共线性问题
缺点——仍没有能够解决原模型滞后阶数k应该取什么值为最好的问题;多项式中阶数m
必须事先确定,而m
的实际确定往往带有很大的主观性;并没能完全消除多重共线性问题对回归模型的影响。
3.
自回归模型
自适应预期经济理论假定(解释变量为不可观测变量)
经济理论基础:影响被解释变量Yt的因素不是Xt而是Xt+1的预期
假定:自适应预期假定——预期形成是一个根据预期误差不断调整的过程,预期误差乘以预期调整系数就是两个时期预期值的改变量
不可观测变量的变换方法:引入预期调整系数,通过自适应预期假定,将自适应预期模型变换成一阶自回归模型
部分调整模型的经济理论假定(被解释变量为不可观测变量)
行为假定:模型所表达的不应是t
期解释变量观测值与同期被解释变量观测值之间的关系,而应是t
期解释变量观测值与同期被解释变量希望达到的水平之间的关系。
不可观测变量的变换方法:引入部分调整系数,将部分调整模型变换成一阶自回归模型
4.
自适应预期模型的估计(IV),部分调整模型的估计(OLS)
自适应预期模型的估计
一般表达式:
特点:在模型中出现了滞后被解释变量Yt-1作为Yt的解释变量,而Yt-1是随机的,这就违背了解释变量是非随机变量的经典假定,这一点与部分调整模型相同。
模型中的随机误差项存在自相关,违背了经典假设条件。
工具变量法(IV):
基本思想是选择适当的一个外生变量或几个外生变量的组合作为工具变量,使得它同模型中随机解释变量高度相关、与随机误差项无关,且与模型中其它解释变量也无关,然后,对在原模型基础上求得的正规方程组,用该工具变量代替相应正规方程组中的随机解释变量。
部分调整模型的估计
由于部分调整模型滞后被解释变量与误差项同期不相关,因此可使用普通最小二乘法(OLS)进行参数估计,得到有偏、一致的估计量。
5.
了解格兰杰因果关系检验方法
从统计上确认两个变量在时间上有先后关系,Granger提出了一个比较简单的检验方法。