计量经济学全部答案(庞浩)第二版
第二章练习题及参考解答
2.1 为研究中国的货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相互依存关系,分析表中1990年—2007年中国货币供应量(M2)和国内生产总值(GDP)的有关数据:
表2.9 1990年—2007年中国货币供应量和国内生产总值(单位:亿元)
年份
货币供应量M2
国内生产总值GDP
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
15293.4
19349.9
25402.2
34879.8
46923.5
60750.5
76094.9
90995.3
104498.5
119897.9
134610.4
158301.9
185007.0
221222.8
254107.0
298755.7
345603.6
403442.2
18718.3
21826.2
26937.3
35260.0
48108.5
59810.5
70142.5
78060.8
83024.3
88479.2
98000.5
108068.2
119095.7
135174.0
159586.7
184088.6
213131.7
251483.2
资料来源:中国统计年鉴2008,中国统计出版社
对货币供应量与国内生产总值作相关分析,并说明相关分析结果的经济意义。
练习题2.1 参考解答:
计算中国货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相关系数为:
计算方法:
或
计算结果:
M2
GDP
M2
1
0.996426148646
GDP
0.996426148646
1
经济意义: 这说明中国货币供应量与国内生产总值(GDP)的线性相关系数为0.996426,线性相关程度相当高。
2.2 为研究美国软饮料公司的广告费用X与销售数量Y的关系,分析七种主要品牌软饮料公司的有关数据
表2.10 美国软饮料公司广告费用与销售数量
品牌名称
广告费用X(百万美元)
销售数量Y(百万箱)
Coca-Cola Classic
131.3
1929.2
Pepsi-Cola
92.4
1384.6
Diet-Coke
60.4
811.4
Sprite
55.7
541.5
Dr.Pepper
40.2
546.9
Moutain Dew
29.0
535.6
7-Up
11.6
219.5
资料来源:(美) Anderson D R等. 商务与经济统计.机械工业出版社.1998. 405
绘制美国软饮料公司广告费用与销售数量的相关图, 并计算相关系数,分析其相关程度。能否在此基础上建立回归模型作回归分析?
练习题2.2参考解答
美国软饮料公司的广告费用X与销售数量Y的散点图为
说明美国软饮料公司的广告费用X与销售数量Y正线性相关。
相关系数为:
x
y
x
1
0.978148015384
y
0.978148015384
1
说明美国软饮料公司的广告费用X与销售数量Y的正相关程度相当高。
若以销售数量Y为被解释变量,以广告费用X为解释变量,可建立线性回归模型
利用EViews估计其参数结果为
经t检验表明, 广告费用X对美国软饮料公司的销售数量Y确有显著影响。回归结果表明,广告费用X每增加1百万美元, 平均说来软饮料公司的销售数量将增加14.40359(百万箱)。
2.3 为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:
表2.11 深圳市地方预算内财政收入与国内生产总值
年 份
地方预算内财政收入Y
(亿元)
本市生产总值(GDP)X
(亿元)
1990
21.70
171.67
1991
27.33
236.66
1992
42.96
317.32
1993
67.25
453.14
1994
74.40.
634.67
1995
88.02
842.48
1996
131.75
1048.44
1997
142.06
1297.42
1998
164.39
1534.73
1999
184.21
1804.02
2000
221.92
2187.45
2001
262.49
2482.49
2002
265.93
2969.52
2003
290.84
3585.72
2004
321.47
4282.14
2005
421.38
4950.91
2006
500.88
5813.56
2007
658.06
6801.57
资料来源: 深圳市统计年鉴2008. 中国统计出版社
(1)建立深圳地方预算内财政收入对本市生产总值GDP的回归模型;
(2)估计所建立模型的参数,解释斜率系数的经济意义;
(3)对回归结果进行检验。
(4)若是2008年深圳市的本市生产总值为8000亿元,试对 2008年深圳市的财政收入作出点预测和区间预测 ()。
练习题2.3参考解答:
1、 建立深圳地方预算内财政收入对GDP的回归模型,建立EViews文件,利用地方预算内财政收入(Y)和GDP的数据表,作散点图
可看出地方预算内财政收入(Y)和GDP的关系近似直线关系,可建立线性回归模型:
利用EViews估计其参数结果为
即
(9.8674) (0.0033)
t=(2.0736) (26.1038)
R2=0.9771 F=681.4064
经检验说明,深圳市的GDP对地方财政收入确有显著影响。,说明GDP解释了地方财政收入变动的近98%,模型拟合程度较好。
模型说明当GDP 每增长1亿元时,平均说来地方财政收入将增长0.0850亿元。
当2008年GDP 为7500亿元时,地方财政收入的点预测值为:
(亿元)
区间预测:
为了作区间预测,取,平均值置信度95%的预测区间为:
利用EViews由GDP数据的统计量得到 n=18
则有
取,,平均值置信度95%的预测区间为:
时
(亿元)
个别值置信度95%的预测区间为:
即
(亿元)
2.4 为研究中国改革开放以来国民总收入与最终消费的关系,搜集到以下数据:
表2.12 中国国民总收入与最终消费 (单位:亿元)
年份
国民总收入X
最终消费
Y
年份
国民总收入
X
最终消费
Y
1978
3645.217
2239.1
1993
35260.02
21899.9
1979
4062.579
2633.7
1994
48108.46
29242.2
1980
4545.624
3007.9
1995
59810.53
36748.2
1981
4889.461
3361.5
1996
70142.49
43919.5
1982
5330.451
3714.8
1997
78060.83
48140.6
1983
5985.552
4126.4
1998
83024.28
51588.2
1984
7243.752
4846.3
1999
88479.15
55636.9
1985
9040.737
5986.3
2000
98000.45
61516
1986
10274.38
6821.8
2001
108068.2
66878.3
1987
12050.62
7804.6
2002
119095.7
71691.2
1988
15036.82
9839.5
2003
135174
77449.5
1989
17000.92
11164.2
2004
159586.7
87032.9
1990
18718.32
12090.5
2005
184088.6
97822.7
1991
21826.2
14091.9
2006
213131.7
110595.3
1992
26937.28
17203.3
2007
251483.2
128444.6
资料来源:中国统计年鉴2008. 中国统计出版社,2008.
(1) 以分析国民总收入对消费的推动作用为目的,建立线性回归方程,并估计其参数。
(2)
计算回归估计的MATCH_
word
word文档格式规范word作业纸小票打印word模板word简历模板免费word简历
_1714163806340_1误差和可决系数。
(3) 对回归系数进行显著性水平为5%的显著性检验。
(4) 如果2008年全年国民总收入为300670亿元,比上年增长9.0%,预测可能达到的最终
消费水平,并对最终消费的均值给出置信度为95%的预测区间。
练习题2.4参考解答:
(1)以最终消费为被解释变量Y,以国民总收入为解释变量X,建立线性回归模型:
利用EViews估计参数并检验
回归分析结果为:
(895.4040) (0.00967)
t= (3.3999) (54.8208)
n=30
(2)回归估计的标准误差即估计的随机扰动项的标准误差,由EViews估计参数和检验结果得, 可决系数为0.9908。
(3)由t分布表可查得,由于 ,或由P值=0.000可以看出, 对回归系数进行显著性水平为5%的显著性检验表明, 国民总收入对最终消费有显著影响。
(4)如果2008年全年国民总收入为300670亿元,预测可能达到的最终消费水平为:
(亿元)
对最终消费的均值置信度为95%的预测区间为:
由Eviews计算国民总收入X变量样本数据的统计量得:
n=30
则有
取,,,已知 ,平均值置信度95%的预测区间为:
=
=(亿元)
2.5 美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下[footnoteRef:1]。 [1: 资料来源:(美)David R.Anderson等《商务与经济统计》,第405页,机械工业出版社]
表2.13 美国各航空公司业绩的统计数据
航空公司名称
航班正点率(%)
投诉率(次/10万名乘客)
西南(Southwest)航空公司
81.8
0.21
大陆(Continental)航空公司
76.6
0.58
西北(Northwest)航空公司
76.6
0.85
美国(US Airways)航空公司
75.7
0.68
联合(United)航空公司
73.8
0.74
美洲(American)航空公司
72.2
0.93
德尔塔(Delta)航空公司
71.2
0.72
美国西部(Americawest)航空公司
70.8
1.22
环球(TWA)航空公司
68.5
1.25
资料来源:(美) Anderson D R等.商务与经济统计. 机械工业出版社.1998,405.
(1)画出这些数据的散点图
(2)根据散点图。表明二变量之间存在什么关系?
(3)估计描述投诉率如何依赖航班按时到达正点率的回归方程。
(4)对估计的回归方程斜率的意义作出解释。
(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?
练习题2.5参考解答:
美国各航空公司航班正点到达比率X和每10万名乘客投诉次数Y的散点图为
由图形看出航班正点到达比率和每10万名乘客投诉次数呈现负相关关系,
利用EViews计算线性相关系数为:
X
Y
X
1
-0.882607
Y
-0.882607
建立描述投诉率(Y)依赖航班按时到达正点率(X)的回归方程:
利用EViews估计其参数结果为
即
(1.017832)(-0.014176)
t=(5.718961) (-4.967254)
R2=0.778996 F=24.67361
从检验结果可以看出, 航班正点到达比率对乘客投诉次数确有显著影响。
这说明当航班正点到达比率每提1个百分点, 平均说来每10万名乘客投诉次数将下降0.07次。
如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数为
(次)
2.6 表2.34中是16支公益股票某年的每股帐面价值Y和当年红利X的数据:
表2.14 某年16支公益股票每股帐面价值和当年红利
公司序号
帐面价值Y(元)
红利X(元)
公司序号
帐面价值Y(元)
红利X(元)
1
22.44
2.4
9
12.14
0.80
2
20.89
2.98
10
23.31
1.94
3
22.09
2.06
11
16.23
3.00
4
14.48
1.09
12
0.56
0.28
5
20.73
1.96
13
0.84
0.84
6
7
8
19.25
20.37
26.43
1.55
2.16
1.60
14
15
16
18.05
12.45
11.33
1.80
1.21
1.07
(1)分析每股帐面价值和当年红利的相关性?
(2) 建立每股帐面价值和当年红利的回归方程;
(3)解释回归系数的经济意义。
练习题2.6参考解答:
1.分析每股帐面价值和当年红利的相关性
作散布图:
从图形看似乎具有一定正相关性,计算相关系数:
每股帐面价值和当年红利的相关系数为0.708647
2.建立每股帐面价值X和当年红利Y的回归方程:
回归结果:
参数的t检验:t值为3.7580,查表<,或者P值为0.0021<,表明每股红利对帐面价值有显著的影响。
3.回归系数的经济意义:
平均说来公司的股票每股红利增加1元,当年帐面价值将增加6.8942元
2.7 设销售收入X为解释变量,销售成本Y为被解释变量。现已根据某百货公司某年12个月的有关资料计算出以下数据:(单位:万元)
(1) 拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。
(2) 计算可决系数和回归估计的标准误差。
(3)
对进行显著水平为5%的显著性检验。
(4) 假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置信度为95%的预测区间。
练习题2.7参考解答:
(1)建立回归模型:
用OLS法估计参数:
估计结果为:
说明该百货公司销售收入每增加1元,平均说来销售成本将增加0.7863元。
(2)计算可决系数和回归估计的标准误差
可决系数为:
由 可得
回归估计的标准误差:
(3) 对进行显著水平为5%的显著性检验
查表得 时,<
表明显著不为0,销售收入对销售成本有显著影响.
(4) 假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置信度为95%的预测区间。
万元
预测区间为:
2.8 表2.15中是1992年亚洲各国人均寿命(Y)、按购买力平价计算的人均GDP(X1)、成人识字率(X2)、一岁儿童疫苗接种率(X3)的数据:
表2.15 1992年亚洲各国人均寿命等数据
序号
国家和
地区
平均寿命
Y (年)
人均GDP
X1(100美元)
成人识字率X2(%)
一岁儿童疫苗接种率X3 (%)
1
日本
79
194
99
99
2
中国香港
77
185
90
79
3
韩国
70
83
97
83
4
新加坡
74
147
92
90
5
泰国
69
53
94
86
6
马来西亚
70
74
80
90
7
斯里兰卡
71
27
89
88
8
中国大陆
70
29
80
94
9
菲律宾
65
24
90
92
10
朝鲜
71
18
95
96
11
蒙古
63
23
95
85
12
印度尼西亚
62
27
84
92
13
越南
63
13
89
90
14
缅甸
57
7
81
74
15
巴基斯坦
58
20
36
81
16
老挝
50
18
55
36
17
印度
60
12
50
90
18
孟加拉国
52
12
37
69
19
柬埔寨
50
13
38
37
20
尼泊尔
53
11
27
73
21
不丹
48
6
41
85
22
阿富汗
43
7
32
35
资料来源:联合国发展规划署. 人的发展
报告
软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载
. 1993
(1)分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系。
(2)对所建立的多个回归模型进行检验。
(3)分析对比各个简单线性回归模型。
练习题2.8参考解答:
(1) 分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系:
1) 人均寿命与人均GDP关系
估计检验结果:
2) 人均寿命与成人识字率关系
3) 人均寿命与一岁儿童疫苗接种率关系
(2)对所建立的多个回归模型进行检验
由人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命回归结果的参数t检验值均明确大于其临界值,而且从对应的P值看,均小于0.05,所以人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命都有显著影响.
(3)分析对比各个简单线性回归模型
人均寿命与人均GDP回归的可决系数为0.5261
人均寿命与成人识字率回归的可决系数为0.7168
人均寿命与一岁儿童疫苗接种率的可决系数为0.5379
相对说来,人均寿命由成人识字率作出解释的比重更大一些
2.9 按照“弗里德曼的持久收入假说”: 持久消费正比于持久收入,依此假说建立的计量模型没有截距项,设定的模型应该为:,这是一个过原点的回归。在古典假定满足时,证明过原点的回归中的OLS估计量的计算公式是什么?对该模型是否仍有和?对比有截距项模型和无截距项模型参数的OLS估计有什么不同?
练习题2.9参考解答:
没有截距项的过原点回归模型为:
因为
求偏导
令
得 而有截距项的回归为
对于过原点的回归,由OLS原则: 已不再成立, 但是是成立的。
还可以证明对于过原点的回归 ,
而有截距项的回归为 ,
2.10 练习题2.3中如果将“地方财政收入”和“本市生产总值”数据的计量单位分别或同时由”亿元”改为”万元”,重新估计参数,对比参数估计及检验结果与计量单位更改之前有什么区别? 你能从中总结出什么规律性吗?
练习题2.10参考解答:
如果将“地方财政收入Y”和“本市生产总值GDP”数据的计量单位分别或同时由”亿元”改为”万元”,数据变为:
深圳市地方预算内财政收入与国内生产总值
年 份
地方预算内财政收入Y
本市生产总值(GDP)
(亿元)Y1
(万元)Y2
(亿元)GDP1
(万元) GDP2
1990
21.70
217000
171.67
1716700
1991
27.33
273300
236.66
2366600
1992
42.96
429600
317.32
3173200
1993
67.25
672500
453.14
4531400
1994
74.40.
744000
634.67
6346700
1995
88.02
880200
842.48
8424800
1996
131.75
1317500
1048.44
10484400
1997
142.06
1420600
1297.42
12974200
1998
164.39
1643900
1534.73
15347300
1999
184.21
1842100
1804.02
18040200
2000
221.92
2219200
2187.45
21874500
2001
262.49
2624900
2482.49
24824900
2002
265.93
2659300
2969.52
29695200
2003
290.84
2908400
3585.72
35857200
2004
321.47
3214700
4282.14
42821400
2005
421.38
4213800
4950.91
49509100
2006
500.88
5008800
5813.56
58135600
2007
658.06
6580600
6801.57
68015700
A.当“地方财政收入”和“本市生产总值”数据的计量单位均为“亿元”时估计检验结果为:
(9.867440) (0.003255)
t=(2.073593) (26.10376) R2=0.977058
B.当“地方财政收入” 的计量单位为“亿元”,“本市生产总值” 的计量单位为“万元”
时:
(9.867440)(0.000000325)
t=(2.073593) (26.10376) R2=0.977058
C.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“亿元”
时:
(98674.40) (32.54902)
t=(2.073593) (26.10376) R2=0.977058
D.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“万元”
时:
(98674.40) (0.0032549)
t=(2.073593) (26.10376) R2=0.977058
可以总结出,变量度量单位对回归影响的一般规律为:
1)当被解释变量测量单位改变(扩大或缩小常数c倍),而解释变量测量单位不变时:OLS截距和斜率的估计值及标准误差都缩小或扩大为原来的c倍. (如C的情况)
2)当解释变量测量单位改变(扩大或缩小常数c倍),而被解释变量测量单位不变时:OLS斜率的估计值及标准误差扩大或缩小为原来的c倍,但不影响截距的估计. (如B的情况)
3)当被解释变量和解释变量测量单位同时改变相同倍数时,OLS的截距估计值及标准误差扩大为原来的c倍,但不影响斜率的估计. (如D的情况)
4)当被解释变量和解释变量测量单位改变时,不会影响拟合优度.可决系数是纯数没有维度,所以不随计量单位而变化。
第三章练习题参考解答
练习题
3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下:
t=(-3.066806) (6.652983) (3.378064)
R2=0.934331 F=191.1894 n=31
(1) 从经济意义上考察估计模型的合理性。
(2)
在5%显著性水平上,分别检验参数的显著性。
(3) 在5%显著性水平上,检验模型的整体显著性。
3.2根据下列数据试估计偏回归系数、标准误差,以及可决系数与修正的可决系数:
, , , ,
, ,
, ,
,
3.3 经研究发现,家庭书刊消费受家庭收入几户主受教育年数的影响,表中为对某地区部分家庭抽样调查得到样本数据:
家庭书刊年消费支出(元)Y
家庭月平均收入
(元)X
户主受教育年数
(年)T
家庭书刊年消费支出(元)Y
家庭月平均收入
(元)X
户主受教育年数
(年)T
450
1027.2
8
793.2
1998.6
14
507.7
1045.2
9
660.8
2196
10
613.9
1225.8
12
792.7
2105.4
12
563.4
1312.2
9
580.8
2147.4
8
501.5
1316.4
7
612.7
2154
10
781.5
1442.4
15
890.8
2231.4
14
541.8
1641
9
1121
2611.8
18
611.1
1768.8
10
1094.2
3143.4
16
1222.1
1981.2
18
1253
3624.6
20
(1) 建立家庭书刊消费的计量经济模型;
(2)利用样本数据估计模型的参数;
(3)检验户主受教育年数对家庭书刊消费是否有显著影响;
(4)分析所估计模型的经济意义和作用
3.4 考虑以下“期望扩充菲利普斯曲线(Expectations-augmented Phillips curve)”模型:
其中:=实际通货膨胀率(%);=失业率(%);=预期的通货膨胀率(%)
下表为某国的有关数据,
表1. 1970-1982年某国实际通货膨胀率Y(%),
失业率X2(%)和预期通货膨胀率X3(%)
年份
实际通货膨胀率Y
(%)
失业率X2
(%)
预期的通货膨胀率X3(%)
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
5.92
4.30
3.30
6.23
10.97
9.14
5.77
6.45
7.60
11.47
13.46
10.24
5.99
4.90
5.90
5.60
4.90
5.60
8.50
7.70
7.10
6.10
5.80
7.10
7.60
9.70
4.78
3.84
3.31
3.44
6.84
9.47
6.51
5.92
6.08
8.09
10.01
10.81
8.00
(1)对此模型作估计,并作出经济学和计量经济学的说明。
(2)根据此模型所估计结果,作计量经济学的检验。
(3)计算修正的可决系数(写出详细计算过程)。
3.5某地区城镇居民人均全年耐用消费品支出、人均年可支配收入及耐用消费品价格指数的统计资料如表所示:
年份
人均耐用消费品支出
Y(元)
人均年可支配收入
X1(元)
耐用消费品价格指数
X2(1990年=100)
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
137.16
124.56
107.91
102.96
125.24
162.45
217.43
253.42
251.07
285.85
327.26
1181.4
1375.7
1501.2
1700.6
2026.6
2577.4
3496.2
4283.0
4838.9
5160.3
5425.1
115.96
133.35
128.21
124.85
122.49
129.86
139.52
140.44
139.12
133.35
126.39
利用表中数据,建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型,进行回归分析,并检验人均年可支配收入及耐用消费品价格指数对城镇居民人均全年耐用消费品支出是否有显著影响。
3.6下表给出的是1960—1982年间7个OECD国家的能源需求指数(Y)、实际GDP指数(X1)、能源价格指数(X2)的数据,所有指数均以1970年为基准(1970=100)
年份
能源需求指数Y
实际GDP指数X1
能源价格指数X2
年份
能源需求指数Y
实际GDP指数X1
能源价格指数X2
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
54.1
55.4
58.5
61.7
63.6
66.8
70.3
73.5
78.3
83.3
88.9
91.8
54.1
56.4
59.4
62.1
65.9
69.5
73.2
75.7
79.9
83.8
86.2
89.8
111.9
112.4
111.1
110.2
109.0
108.3
105.3
105.4
104.3
101.7
97.7
100.3
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
97.2
100.0
97.3
93.5
99.1
100.9
103.9
106.9
101.2
98.1
95.6
94.3
100.0
101.4
100.5
105.3
109.9
114.4
118.3
119.6
121.1
120.6
98.6
100.0
120.1
131.0
129.6
137.7
133.7
144.5
179.0
189.4
190.9
(1)建立能源需求与收入和价格之间的对数需求函数,解释各回归系数的意义,用P值检验所估计回归系数是否显著。
(2) 再建立能源需求与收入和价格之间的线性回归模型 ,解释各回归系数的意义,用P值检验所估计回归系数是否显著。
(3 )比较所建立的两个模型,如果两个模型结论不同,你将选择哪个模型,为什么?
练习题参考解答
练习题3.1参考解答
有模型估计结果可看出:旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数增加1万人次,旅游外汇收入增加1.5452百万美元。
取,查表得
因为3个参数t统计量的绝对值均大于,说明经t检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。
取,查表得,由于,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。
练习题3.3参考解答
(1)建立家庭书刊消费的计量经济模型:
其中:Y为家庭书刊年消费支出、X为家庭月平均收入、T为户主受教育年数
(2)估计模型参数,结果为
即
(49.46026)(0.02936) (5.20217)
t= (-1.011244) (2.944186) (10.06702)
R2=0.951235 F=146.2974
(3) 检验户主受教育年数对家庭书刊消费是否有显著影响:
由估计检验结果, 户主受教育年数参数对应的t 统计量为10.06702, 明显大于t的临界值,同时户主受教育年数参数所对应的P值为0.0000,明显小于,均可判断户主受教育年数对家庭书刊消费支出确实有显著影响。
(4)本模型说明家庭月平均收入和户主受教育年数对家庭书刊消费支出有显著影响,家庭月平均收入增加1元,家庭书刊年消费支出将增加0.086元,户主受教育年数增加1年,家庭书刊年消费支出将增加52.37元。
练习题3.5参考解答
(1) 建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型:
(2)估计参数结果
由估计和检验结果可看出,该地区人均年可支配收入的参数的t检验值为10.54786,其绝对值大于临界值;而且对应的P值为0.0000,也明显小于。说明人均年可支配收入对该地区城镇居民人均全年耐用消费品支出确实有显著影响。
但是,该地区耐用消费品价格指数的参数的t检验值为-0.921316,其绝对值小于临界值;而且对应的P值为0.3838,也明显大于。这说明该地区耐用消费品价格指数对城镇居民人均全年耐用消费品支出并没有显著影响
第四章
4.1 假设在模型中,之间的相关系数为零,于是有人建议你进行如下回归:
(1)是否存在?为什么?
(2)
(3)是否有?
练习题4.1参考解答:
(1) 存在。
因为
当之间的相关系数为零时,离差形式的
有
同理有:
(2)
因为 ,且,
由于,则
则
(3) 存在。
因为
当时,
同理,有
4.2在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而作出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么?
练习题4.2参考解答:
根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不能反映引进新的解释变量后的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某个解释变量被剔出就再也没有机会重新进入方程。而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而呈现出不同,所以要寻找到“最优”变量子集则采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。
4.3 下表给出了中国商品进口额Y、国内生产总值GDP、居民消费价格指数CPI。
表4.11 中国商品进口额、国内生产总值、居民消费价格指数
年份
商品进口额
(亿元)
国内生产总值
(亿元)
居民消费价格指数(1985=100)
1985
1257.8
9016.0
100.0
1986
1498.3
10275.2
106.5
1987
1614.2
12058.6
114.3
1988
2055.1
15042.8
135.8
1989
2199.9
16992.3
160.2
1990
2574.3
18667.8
165.2
1991
3398.7
21781.5
170.8
1992
4443.3
26923.5
181.7
1993
5986.2
35333.9
208.4
1994
9960.1
48197.9
258.6
1995
11048.1
60793.7
302.8
1996
11557.4
71176.6
327.9
1997
11806.5
78973.0
337.1
1998
11626.1
84402.3
334.4
1999
13736.4
89677.1
329.7
2000
18638.8
99214.6
331.0
2001
20159.2
109655.2
333.3
2002
24430.3
120332.7
330.6
2003
34195.6
135822.8
334.6
2004
46435.8
159878.3
347.7
2005
54273.7
183084.8
353.9
2006
63376.9
211923.5
359.2
2007
73284.6
249529.9
376.5
资料来源:《中国统计年鉴》,中国统计出版社2000年、2008年。
请考虑下列模型:
1)利用表中数据估计此模型的参数。
2)你认为数据中有多重共线性吗?
3)进行以下回归:
根据这些回归你能对数据中多重共线性的性质说些什么?
4)假设数据有多重共线性,但在5%水平上个别地显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?
练习题4.3参考解答:
(1) 参数估计结果如下
(括号内为标准误)
(2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且且CPI与进口之间的简单相关系数呈现正向变动。可能数据中有多重共线性。
计算相关系数:
(3)最大的CI=108.812,表明GDP与CPI之间存在较高的线性相关。
(4)分别拟合的回归模型如下:
单方程拟合效果都很好,回归系数显著,可决系数较高,GDP和CPI对进口分别有显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。
(5)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意。
4.4 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现?
练习题4.4参考解答:
本题很灵活,主要应注意以下问题:
(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。
(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。
4.5 克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:
括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析,指出其中存在的问题。
练习题4.5参考解答:
从模型拟合结果可知,样本观测个数为27,消费模型的判定系数,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。
依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值:
除外,其余的值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。
另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。
4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值 (亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2007年期间的统计数据,具体如表4.2所示。
表4.12 1985~2007年统计数据
年份
能源消费
国民
总收入
国内生
产总值
工业
增加值
建筑业
增加值
交通运输邮电
增加值
人均生活
电力消费
能源加工
转换效率
y
X1
X2
X3
X4
X5
X6
X7
1985
76682
9040.7
9016
3448.7
417.9
406.9
21.3
68.29
1986
80850
10274.4
10275.2
3967
525.7
475.6
23.2
68.32
1987
86632
12050.6
12058.6
4585.8
665.8
544.9
26.4
67.48
1988
92997
15036.8
15042.8
5777.2
810
661
31.2
66.54
1989
96934
17000.9
16992.3
6484
794
786
35.3
66.51
1990
98703
18718.3
18667.8
6858
859.4
1147.5
42.4
67.2
1991
103783
21826.2
21781.5
8087.1
1015.1
1409.7
46.9
65.9
1992
109170
26937.3
26923.5
10284.5
1415
1681.8
54.6
66.00
1993
115993
35260
35333.9
14188
2266.5
2205.6
61.2
67.32
1994
122737
48108.5
48197.9
19480.7
2964.7
2898.3
72.7
65.2
1995
131176
59810.5
60793.7
24950.6
3728.8
3424.1
83.5
71.05
1996
138948
70142.5
71176.6
29447.6
4387.4
4068.5
93.1
71.5
1997
137798
77653.1
78973
32921.4
4621.6
4593
101.8
69.23
1998
132214
83024.3
84402.3
34018.4
4985.8
5178.4
106.6
69.44
1999
133831
88189
89677.1
35861.5
5172.1
5821.8
118.2
69.19
2000
138553
98000.5
99214.6
4003.6
5522.3
7333.4
132.4
69.04
2001
143199
108068.2
109655.2
43580.6
5931.7
8406.1
144.6
69.03
2002
151797
119095.7
120332.7
47431.3
6465.5
9393.4
156.3
69.04
2003
174990
135174
135822.8
54945.5
7490.8
10098.4
173.7
69.4
2004
203227
159586.7
159878.3
65210
8694.3
12147.6
190.2
70.71
2005
223319
183956.1
183084.8
76912.9
10133.8
10526.1
216.7
71.08
2006
246270
213131.7
211923.5
91310.9
11851.1
12481.1
249.4
71.24
2007
265583
251483.2
249529.9
107367.2
14014.1
14604.1
274.9
71.25
资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。
要求:
1)建立对数多元线性回归模型,分析回归结果。
2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?
3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。
练习题4.6参考解答:
(1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下:
生成: lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7.
作全部变量对数线性多元回归,结果为:
从修正的可决系数和F统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,,各变量联合起来对能源消费影响显著。可是其中的lnX3、lnX4、lnX6对lnY影响不显著,而且lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。
(2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与GDP本来就是一对关联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是GDP的组成部分。这两组指标必定存在高度相关。
解释变量国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关,计算相关系数如下:
可以看出lnx1与lnx2、lnx3、lnx4、lnx5、lnx6之间高度相关,许多相关系数高于0.900以上。如果决定用表中全部变量作为解释变量,很可能会出现严重多重共线性问题。
(3)因为存在多重共线性,解决方法如下:
A:修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:而对变量取对数后,能源消费总量的对数与人均生活电力消费的对数相关程度最高,可建立这两者之间的回归模型。如
B:进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。采用逐步回归的办法,去检验和解决多重共线性问题。分别作对的一元回归,结果如下:
一元回归结果:
变量
lnX1
lnX2
lnX3
lnX4
lnX5
lnX6
lnX7
参数估计值
0.316
0.315
0.277
0.297
0.273
0.421
8.73
t统计量
14.985
14.62
9.718
13.22
11.717
16.173
4.648
可决系数
0.914
0.911
0.818
0.893
0.867
0.926
0.507
调整可决系数
0.910
0.906
0.809
0.888
0.861
0.922
0.484
其中加入lnX6的方程调整的可决系数最大, 以lnX6为基础, 顺次加入其他变量逐步回归。结果如下表:
变量
lnX1
lnX2
lnX3
lnX4
lnX5
lnX6
lnX7
lnX6
lnX1
-0.186
(-0.698)
0.666
(1.891)
0.920
lnX6
lnX2
-0.251
(-1.021)
0.753
(2.308)
0.922
lnX6
lnX3
0.061
(1.548)
0.341
(5.901)
0.927
lnX6
lnX4
-0.119
(-0.897)
0.585
(3.167)
0.921
lnX6
lnX5
-0.623
(-7.127)
1.344
(10.314)
0.977
lnX6
lnX7
0.391
(11.071)
0.924
经比较,新加入lnX5的方程调整可决系数改进最大, 各参数的t检验也都显著,但是lnX5参数的符号与经济意义不符合。若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义的变量后, 仍为第一步所建只包含lnX6的一元回归模型。
如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。
例如, 不取对数作全部变量多元线性回归,结果为:
可以看出还是有严重多重共线性。作逐步回归:
分别作一元回归得到:
变量
X1
X2
X3
X4
X5
X6
X7
参数估计值
0.7333
0.7353
1.6655
13.1909
10.8980
678.0058
19332.30
t 统计量
26.4698
25.3627
18.0257
25.9636
13.5147
22.4229
4.7024
0.9709
0.9684
0.9393
0.9697
0.8969
0.9599
0.5129
0.9695
0.9669
0.9364
0.9683
0.8920
0.9580
0.4897
以X1为基础加入其他变量, 结果为:
X1
X2
X3
X4
X5
X6
X7
X1,X2
6.6399(0.0022)
-5.9308
(0.0054)
0.9785
X1,X3
0.5512
(0.0000)
0.4349
(0.0821)
0.9726
X1,X4
0.5040
(0.3356)
4.1326
(0.6580)
0.9683
X1,X5
1.0516
(0.0000)
-5.0269
(0.013)
0.9766
X1,X6
1.0075
(0.0088)
-255.80
(0.438)
0.9690
X1,X7
0.7499
(0.0000)
-813.44
(0.5988)
0.9684
注: 括号中为p值.
可以发现加入X2、X5、X6、X7后参数的符号不合理,加入X4后并不显著。只有加入X3后修正的可决系数有所提高,而且参数符号的经济意义合理, X3参数估计值的p值为0.0821,在10%的显著性水平下是显著的。所以相对较为合理的模型估计结果可以为:
可是这里的lnX2和lnX5的参数符号为负,在经济意义上并不合理。说明多重共线性影响仍然很严重。
可是,这里的X2的参数为负,是不合理的。
从经济意义上看,在各种回归结果中,选择X1 和x3的估计检验结果为:
参数经济意义合理,其中的X3在下是显著的。相对说更为合理。
4.7 在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗?”的例子中,如果所采用的数据如下表所示
表4.13 1978-2007年财政收入及其影响因素数据
年份
财政收入(亿元)CS
农业增加值(亿元)NZ
工业增加值(亿元)GZ
建筑业增加值(亿元)JZZ
总人口(万人)TPOP
最终消费(亿元)CUM
受灾面积(千公顷)SZM
1978
1132.3
1027.5
1607
138.2
96259
2239.1
50790
1979
1146.4
1270.2
1769.7
143.8
97542
2633.7
39370
1980
1159.9
1371.6
1996.5
195.5
98705
3007.9
44526
1981
1175.8
1559.5
2048.4
207.1
100072
3361.5
39790
1982
1212.3
1777.4
2162.3
220.7
101654
37148
33130
1983
1367
1978.4
2375.6
270.6
103008
4126.4
34710
1984
1642.9
2316.1
2789
316.7
104357
4846.3
31890
1985
2004.8
2564.4
3448.7
417.9
105851
5986.3
44365
1986
2122
2788.7
3967
525.7
107507
6821.8
47140
1987
2199.4
3233.0
4585.8
665.8
109300
7804.6
42090
1988
2357.2
3865.4
5777.2
810
111026
9839.5
50870
1989
2664.9
4265.9
6484
794
112704
11164.2
46991
1990
2937.1
5062.0
6858
859.4
114333
12090.5
38474
1991
3149.48
5342.2
8087.1
1015.1
115823
14091.9
55472
1992
3483.37
5866.6
10284.5
1415
117171
17203.3
51333
1993
4348.95
6963.8
14188
2266.5
118517
21899.9
48829
1994
5218.1
9572.7
19480.7
2964.7
119850
29242.2
55043
1995
6242.2
12135.8
24950.6
3728.8
121121
36748.2
45821
1996
7407.99
14015.4
29447.6
4387.4
122389
43919.5
46989
1997
8651.14
14441.9
32921.4
4621.6
123626
48140.6
53429
1998
9875.95
14817.6
34018.4
4985.8
124761
51588.2
50145
1999
11444.08
14770.0
35861.5
5172.1
125786
55636.9
49981
2000
13395.23
14944.7
4003.6
5522.3
126743
61516
54688
2001
16386.04
15781.3
43580.6
5931.7
127627
66878.3
52215
2002
18903.64
16537.0
47431.3
6465.5
128453
71691.2
47119
2003
21715.25
17381.7
54945.5
7490.8
129227
77449.5
54506
2004
26396.47
21412.7
65210
8694.3
129988
87032.9
37106
2005
31649.29
22420.0
76912.9
10133.8
130756
96918.1
38818
2006
38760.20
24040.0
91310.9
11851.1
131448
110595.3
41091
2007
51321.78
28095.0
107367.2
14014.1
132129
128444.6
48992
(资料来源:《中国统计年鉴2008》,中国统计出版社2008年版)
试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题?
练习题4.7参考解答:
(1)根据样本数据得到各解释变量的样本相关系数矩阵如下:
样本相关系数矩阵
解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.9以上。这显然与第三章对模型的无多重共线性假定不符合。
(2)解决
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
:
采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。
合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。
取对数再回归,可以减低共线性。
第五章
5.1 设消费函数为
式中,为消费支出;为个人可支配收入;为个人的流动资产;为随机误差项,并且(其中为常数)。试解答以下问题:
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
练习题5.1参考解答:
(1)因为,所以取,用乘给定模型两端,得
上述模型的随机误差项的方差为一固定常数,即
(2)根据加权最小二乘法,可得修正异方差后的参数估计式为
其中
5.2 下表是消费Y与收入X的数据,试根据所给数据资料完成以下问题:
(1)估计回归模型中的未知参数和,并写出样本回归模型的书写格式;
(2)试用Goldfeld-Quandt法和White法检验模型的异方差性;
(3)选用合适的方法修正异方差。
表5.8 某地区消费Y与收入X的数据(单位:亿元)
Y
X
Y
X
Y
X
55
80
152
220
95
140
65
100
144
210
108
145
70
85
175
245
113
150
80
110
180
260
110
160
79
120
135
190
125
165
84
115
140
205
115
180
98
130
178
265
130
185
95
140
191
270
135
190
90
125
137
230
120
200
75
90
189
250
140
205
74
105
55
80
140
210
110
160
70
85
152
220
113
150
75
90
140
225
125
165
65
100
137
230
108
145
74
105
145
240
115
180
80
110
175
245
140
225
84
115
189
250
120
200
79
120
180
260
145
240
90
125
178
265
130
185
98
130
191
270
练习题5.2参考解答:
(1)该模型样本回归估计式的书写形式为
(2)首先,用Goldfeld-Quandt法进行检验。
将样本X按递增顺序排序,去掉中间1/4的样本,再分为两个部分的样本,即。
分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即
求F统计量为
给定,查F分布表,得临界值为。
c.比较临界值与F统计量值,有=4.1390>,说明该模型的随机误差项存在异方差。
其次,用White法进行检验。具体结果见下表
White Heteroskedasticity Test:
F-statistic
6.301373
Probability
0.003370
Obs*R-squared
10.86401
Probability
0.004374
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 08/05/05 Time: 12:37
Sample: 1 60
Included observations: 60
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-10.03614
131.1424
-0.076529
0.9393
X
0.165977
1.619856
0.102464
0.9187
X^2
0.001800
0.004587
0.392469
0.6962
R-squared
0.181067
Mean dependent var
78.86225
Adjusted R-squared
0.152332
S.D. dependent var
111.1375
S.E. of regression
102.3231
Akaike info criterion
12.14285
Sum squared resid
596790.5
Schwarz criterion
12.24757
Log likelihood
-361.2856
F-statistic
6.301373
Durbin-Watson stat
0.937366
Prob(F-statistic)
0.003370
给定,在自由度为2下查卡方分布表,得。比较临界值与卡方统计量值,即,同样说明模型中的随机误差项存在异方差。
(2)用权数,作加权最小二乘估计,得如下结果
Dependent Variable: Y
Method: Least Squares
Date: 08/05/05 Time: 13:17
Sample: 1 60
Included observations: 60
Weighting series: W1
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
10.37051
2.629716
3.943587
0.0002
X
0.630950
0.018532
34.04667
0.0000
Weighted Statistics
R-squared
0.211441
Mean dependent var
106.2101
Adjusted R-squared
0.197845
S.D. dependent var
8.685376
S.E. of regression
7.778892
Akaike info criterion
6.973470
Sum squared resid
3509.647
Schwarz criterion
7.043282
Log likelihood
-207.2041
F-statistic
1159.176
Durbin-Watson stat
0.958467
Prob(F-statistic)
0.000000
Unweighted Statistics
R-squared
0.946335
Mean dependent var
119.6667
Adjusted R-squared
0.945410
S.D. dependent var
38.68984
S.E. of regression
9.039689
Sum squared resid
4739.526
Durbin-Watson stat
0.800564
用White法进行检验得如下结果:
White Heteroskedasticity Test:
F-statistic
3.138491
Probability
0.050925
Obs*R-squared
5.951910
Probability
0.050999
给定,在自由度为2下查卡方分布表,得。比较临界值与卡方统计量值,即,说明加权后的模型中的随机误差项不存在异方差。其估计的书写形式为
5.3 下表是2007年我国各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据
表5.9 各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据(单位:元)
地 区
家庭人均纯收入
家庭生活消费支出
地 区
家庭人均纯收入
家庭生活消费支出
北 京
9439.63
6399.27
湖 北
3997.48
3090
天 津
7010.06
3538.31
湖 南
3904.2
3377.38
河 北
4293.43
2786.77
广 东
5624.04
4202.32
山 西
3665.66
2682.57
广 西
3224.05
2747.47
内蒙古
3953.1
3256.15
海 南
3791.37
2556.56
辽 宁
4773.43
3368.16
重 庆
3509.29
2526.7
吉 林
4191.34
3065.44
四 川
3546.69
2747.27
黑龙江
4132.29
3117.44
贵 州
2373.99
1913.71
上 海
10144.62
8844.88
云 南
2634.09
2637.18
江 苏
6561.01
4786.15
西 藏
2788.2
2217.62
浙 江
8265.15
6801.6
陕 西
2644.69
2559.59
安 徽
3556.27
2754.04
甘 肃
2328.92
2017.21
福 建
5467.08
4053.47
青 海
2683.78
2446.5
江 西
4044.7
2994.49
宁 夏
3180.84
2528.76
山 东
4985.34
3621.57
新 疆
3182.97
2350.58
河 南
3851.6
2676.41
(1)试根据上述数据建立2007年我国农村居民家庭人均消费支出对人均纯收入的线性回归模型。
(2)选用适当方法检验模型是否在异方差,并说明存在异方差的理由。
(3)如果存在异方差,用适当方法加以修正。
练习题5.3参考解答:
解: (1)建立样本回归函数。
(0.808709)(15.74411)
(2)利用White方法检验异方差,则White检验结果见下表:
Heteroskedasticity Test: White
F-statistic
7.194463
Prob. F(2,28)
0.0030
Obs*R-squared
10.52295
Prob. Chi-Square(2)
0.0052
Scaled explained SS
30.08105
Prob. Chi-Square(2)
0.0000
由上述结果可知,该模型存在异方差。分析该模型存在异方差的理由是,从数据可以看出,一是截面数据;二是各省市经济发展不平衡,使得一些省市农村居民收入高出其它省市很多,如上海市、北京市、天津市和浙江省等。而有的省就很低,如甘肃省、贵州省、云南省和陕西省等。
(3)用加权最小二乘法修正异方差,分别选择权数,经过试算,认为用权数的效果最好。结果如下:
书写结果为
5.4 下表是某一地区31年中个人储蓄和个人收入数据资料
表5.10 个人储蓄和个人收入数据(单位:元)
时期
储蓄额(Y)
收入额(X)
时期
储蓄额(Y)
收入额(X)
1
264
8777
17
1578
24127
2
105
9210
18
1654
25604
3
90
9954
19
1400
26500
4
131
10508
20
1829
27670
5
122
10979
21
2200
28300
6
107
11912
22
2017
27430
7
406
12747
23
2105
29560
8
503
13499
24
1600
28150
9
431
14269
25
2250
32100
10
588
15522
26
2420
32500
11
898
16730
27
2570
35250
12
950
17663
28
1720
33500
13
779
18575
29
1900
36000
14
819
19635
30
2100
36200
15
1222
21163
31
2300
38200
16
1702
22880
(1)建立一元回归函数,判断有无异方差存在,并说明存在异方差的原因。
(2)用适当方法修正异方差。
练习题5.4参考解答:
(1)建立样本回归函数。
(-5.485018)(17.34164)
从估计的结果看,各项检验指标均显著。但由于收入通常存在不同的差异,因此需要判断模型是否存在异方差。
首先,用图形法。从残差平方对解释变量散点图可以看出(见下图),模型很可能存在异方差。
其次,用运用Goldfeld-Quanadt检验异方差。
第一,对变量X取值以升序排序。
第二,构造子样本。由于本例的样本容量为31,删除1/4观测值,约7个,余下部分分得两个样本区间:1—12和20—31,它们的样本个数均是12个。
第三,在样本区为1—12,所计算得到的残茶平方和为;在样本区为20—31,所计算得到的残茶平方和为。
第四,根据Goldfeld-Quanadt检验,F统计量为。
第五,判断。在显著性水平为0.05条件下,分子分母的自由度均为10,查F分布表得临界值为,因为,所以拒绝原假设,表明模型存在异方差。
最后,用ARCH方法检验异方差,则ARCH检验结果见下表:
Heteroskedasticity Test: ARCH
F-statistic
6.172299
Prob. F(1,28)
0.0192
Obs*R-squared
5.418686
Prob. Chi-Square(1)
0.0199
由上述结论可知,拒绝原假设,则模型中随机误差项存在异方差。
(2)分别用权数,发现用权数求加权最小二乘估计效果最好,即
5.5 下表的数据是2007年我国建筑业总产值(X)和建筑业企业利润总额(Y)。试根据资料建立回归模型,并对模型判断是否存在异方差,如果有异方差,选用适当方法修正。
表5.11 各地区建筑业总产值(X)和建筑业企业利润总额(Y)(单位:万元)
地 区
建筑业总产值x
建筑业企业利润总额y
地 区
建筑业总产值x
建筑业企业利润总额y
北 京
25767692
960256.4
湖 北
21108043
698837.4
天 津
12219419
379211.6
湖 南
18288148
545655.7
河 北
16146909
446520.8
广 东
29995140
1388554.6
山 西
10607041
194565.9
广 西
6127370
126343.1
内蒙古
6811038.3
353362.6
海 南
821834
14615.7
辽 宁
21000402
836846.6
重 庆
11287118
386177.5
吉 林
7383390.8
102742
四 川
21099840
466176
黑龙江
8758777.8
98028.5
贵 州
3487908.1
41893.1
上 海
25241801
794136.5
云 南
7566795.1
266333.1
江 苏
70105724
2368711.7
西 藏
602940.7
52895.2
浙 江
69717052
1887291.7
陕 西
11730972
224646.6
安 徽
15169772
378252.8
甘 肃
4369038.8
152143.1
福 建
15441660
375531.9
青 海
1254431.1
24468.3
江 西
7861403.8
188502.4
宁 夏
1549486.5
25224.6
山 东
32890450
1190084.1
新 疆
4508313.7
68276.6
河 南
21517230
574938.7
数据来源:国家统计局网站
练习题5.5参考解答:
(1)求对的回归,得如下估计结果
用怀特检验的修正方法,即建立如下回归模型
通过计算得到如下结果:
注意,表中E2为残差平方。
即
对该模型系数作判断,运用或检验,可发现存在异方差。
具体EViews操作如下:在得到的估计后,进一步得到残差平方,然后建立对和的线性回归模型。再通过上述回归对和前的系数是否为零进行判断,从而检验原模型中是否存在异方差。在上表界面,按路径:VIEW/COEFFIEICENT TESTS/REDUANDANT VARIABLES,得到如下窗口,并输入变量名“YF YF^2”,即
然后“OK”即得到检验结果为
从表中统计量值和统计量值看,拒绝原假设,表明原模型存在异方差。
(2)通过对权数的试算,最后选择权数,用加权最小二乘法得到如下估计(还原后的结果)
对该模型进行检验,发现已无异方差。
5.6 下表为四川省农村人均纯收入、人均生活费支出、商品零售价格指数1978年至2008年时间序列数据。试根据该资料建立回归模型,并检验是否存在异方差,如果存在异方差,选用适当方法进行修正。
表5.12 1978——2008四川省农村人均纯收入、人均生活费支出、商品零售价格指数
时间
农村人均纯收入X
农村人均生活消费支出Y
商品零售价格指数
时间
农村人均纯收入X
农村人均生活消费支出Y
商品零售价格指数
1978
127.1
120.3
100
1994
946.33
904.28
310.2
1979
155.9
142.1
102
1995
1158.29
1092.91
356.1
1980
187.9
159.5
108.1
1996
1453.42
1349.88
377.8
1981
221
184
110.7
1997
1680.69
1440.48
380.8
1982
256
208.23
112.8
1998
1731.76
1440.77
370.9
1983
258.4
231.12
114.5
1999
1843.47
1426.06
359.8
1984
286.8
251.83
117.7
2000
1903.60
1485.34
354.4
1985
315.07
276.25
128.1
2001
1986.99
1497.52
351.6
1986
337.9
310.92
135.8
2002
2107.64
1591.99
347
1987
369.46
348.32
145.7
2003
2229.86
1747.02
346.7
1988
448.85
426.47
172.7
2004
2580.28
2010.88
356.4
1989
494.07
473.59
203.4
2005
2802.78
2274.17
359.3
1990
557.76
509.16
207.7
2006
3002.38
2395.04
362.9
1991
590.21
552.39
213.7
2007
3546.69
2747.27
376.7
1992
634.31
569.46
225.2
2008
4121.2
3127.9
398.9
1993
698.27
647.43
254.9
资料来源:中经网统计数据库
练习题5.6参考解答:
(1)设表示人均生活费支出,表示农村人均纯收入,则建立样本回归函数
(3.944029)(69.98227)
从估计结果看,各项检验指标均显著,但从经济意义看,改革开放以来,四川省农村经济发生了巨大变化,农村家庭纯收入的差距也有所拉大,使得农村居民的消费水平的差距也有所加大,在这种情况下,尽管是时间序列数据,也有可能存在异方差问题。而且从残差平方对解释变量的散点图可以看出,模型很可能存在异方差(见下图)。
进一步作利用ARCH方法检验异方差,得ARCH检验结果(见下表)
(2)运用加权最小二乘法,选权数为,得如下结果
(3.435081)(59.91014)
经检验,时模型的异方差问题有了明显的改进。
5.7 在5.6题的数据表里,如果考虑物价因素,则对异方差性的修正应该怎样进行?
练习题5.7参考解答:
剔除物价上涨因素后的回归结果如下
其中,代表实际消费支出,代表实际可支配收入。
用ARCH方法来检验模型是否存在异方差:
在显著性水平为0.01的条件下,接收原假设,模型不存在异方差。表明剔除物价上涨因素之后,异方差的问题有所改善。
第六章
6.1 下表给出了美国1960-1995年36年间个人实际可支配收入X和个人实际消费支出Y的数据。
表6.6 美国个人实际可支配收入和个人实际消费支出 (单位:百亿美元)
年份
个人实际可支配收入
X
个人实际
消费支出
Y
年份
个人实际可支配收入
X
个人实际
消费支出
Y
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
157
162
169
176
188
200
211
220
230
237
247
256
268
287
285
290
301
311
143
146
153
160
169
180
190
196
207
215
220
228
242
253
251
257
271
283
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
326
335
337
345
348
358
384
396
409
415
432
440
448
449
461
467
478
493
295
302
301
305
308
324
341
357
371
382
397
406
413
411
422
434
447
458
注:资料来源于Economic Report of the President,数据为1992年价格。
要求:(1)用普通最小二乘法估计收入—消费模型;
(2)检验收入—消费模型的自相关状况(5%显著水平);
(3)用适当的方法消除模型中存在的问题。
练习题6.1参考解答:
(1)收入—消费模型为
Se = (2.5043) (0.0075)
t = (-3.7650) (125.3411)
R2 = 0.9978,F = 15710.39,d f = 34,DW = 0.5234
(2)对样本量为36、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.411,dU= 1.525,模型中DW
dU,说明广义差分模型中已无自相关。同时,可决系数R2、t、F统计量均达到理想水平。
最终的消费模型为
Y t = 13.9366+0.9484 X t
6.2 在研究生产中劳动所占份额的问题时,古扎拉蒂采用如下模型
模型1
模型2
其中,Y为劳动投入,t为时间。据1949-1964年数据,对初级金属工业得到如下结果:
模型1
t = (-3.9608)
R2 = 0.5284 DW = 0.8252
模型2
t = (-3.2724)(2.7777)
R2 = 0.6629 DW = 1.82
其中,括号内的数字为t统计量。
问:(1)模型1和模型2中是否有自相关;
(2)如何判定自相关的存在?
(3)怎样区分虚假自相关和真正的自相关。
练习题6.2参考解答:
(1)模型1中有自相关,模型2中无自相关。
(2)通过DW检验进行判断。
模型1:dL=1.077, dU=1.361, DWdU, 因此无自相关。
(3)如果通过改变模型的设定可以消除自相关现象,则为虚假自相关,否则为真正自相关。
6.3下表是北京市连续19年城镇居民家庭人均收入与人均支出的数据。
表6.7 北京市19年来城镇居民家庭收入与支出数据表(单位:元)
年份
顺序
人均收入
(元)
人均生活消
费支出(元)
商品零售
物价指数(%)
人均实
际收入(元)
人均实际消费支出(元)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
450.18
491.54
599.40
619.57
668.06
716.60
837.65 1158.84
1317.33
1413.24
1767.67
1899.57
2067.33
2359.88
2813.10
3935.39
5585.88
6748.68 7945.78
359.86
408.66
490.44
511.43
534.82
574.06
666.75
923.32
1067.38
1147.60
1455.55
1520.41
1646.05
1860.17
2134.65
2939.60
4134.12
5019.76
5729.45
100.00
101.50
108.60
110.20
112.30
113.00
115.40
136.80
145.90
158.60
193.30
229.10
238.50
258.80
280.30
327.70
386.40
435.10
466.90
450.18
484.28
551.93
562.22
594.89
634.16
725.87
847.11
902.90
891.07
914.47
829.14
866.81
911.85
1003.60
1200.91
1445.62
1551.06
1701.82
359.86
402.62
451.60
464.09
476.24
508.02
577.77
674.94
731.58
723.58
753.00
663.64
690.17
718.77
761.56
897.04
1069.91
1153.70
1227.13
要求:(1)建立居民收入—消费函数;
(2)检验模型中存在的问题,并采取适当的补救措施预以处理;
(3)对模型结果进行经济解释。
练习题6.3参考解答:
(1)收入—消费模型为
(2)DW=0.575,取,查DW上下界,说明误差项存在正自相关。
(3)采用广义差分法
使用普通最小二乘法估计的估计值,得
DW=1.830,已知。因此,在广义差分模型中已无自相关。据,可得:
因此,原回归模型应为
其经济意义为:北京市人均实际收入增加1元时,平均说来人均实际生活消费支出将增加0.669元。
6.4 下表给出了日本工薪家庭实际消费支出与可支配收入数据
表6.8 日本工薪家庭实际消费支出与实际可支配收入 单位:1000日元
年份
个人实际可支配收入
X
个人实际
消费支出
Y
年份
个人实际可支配收入
X
个人实际
消费支出
Y
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
239
248
258
272
268
280
279
282
285
293
291
294
302
300
311
329
351
354
364
360
366
370
378
374
371
381
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
304
308
310
312
314
324
326
332
334
336
334
330
384
392
400
403
411
428
434
441
449
451
449
449
注:资料来源于日本银行《经济统计年报》数据为1990年价格。
要求:(1)建立日本工薪家庭的收入—消费函数;
(2)检验模型中存在的问题,并采取适当的补救措施预以处理;
(3)对模型结果进行经济解释。
要求:(1)检测进口需求模型的自相关性;
(2)采用科克伦-奥克特迭代法处理模型中的自相关问题。
练习题6.4参考解答:
(1)收入—消费模型为
t = (6.1361) (30.0085)
R2 = 0.9751 DW = 0.3528
(2)对样本量为25、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.288,dU= 1.454,模型中DW dU,说明广义差分模型中已无自相关。
最终的消费模型为
Y t = 93.7518+0.5351 X t
(3)模型说明日本工薪居民的边际消费倾向为0.5351,即收入每增加1元,平均说来消费增加0.54元。
6.5下表给出了某地区1980-2000年的地区生产总值(Y)与固定资产投资额(X)的数据。
表6.9 地区生产总值(Y)与固定资产投资额(X) 单位:亿元
年份
地区生产
总值(Y)
固定资产投资额(X)
年份
地区生产
总值(Y)
固定资产投资额(X)
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1402
1624
1382
1285
1665
2080
2375
2517
2741
2730
216
254
187
151
246
368
417
412
438
436
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
3124
3158
3578
4067
4483
4897
5120
5506
6088
7042
8756
544
523
548
668
699
745
667
845
951
1185
1180
要求:(1)使用对数线性模型 进行回归,并检验回归模型的自相关性;
(2)采用广义差分法处理模型中的自相关问题。
(3) 令(固定资产投资指数),(地区生产总值增长指数),使用模型 ,该模型中是否有自相关?
练习题6.5参考解答:
(1)对数模型为
ln(Y)=2.1710+0.9511ln(X)
t = (9.0075) (24.4512)
R2 = 0.9692 DW = 1.1598
样本量n=21,一个解释变量的模型,5%显著水平,查DW统计表可知,dL=1.221,
dU= 1.420,模型中DW dU,说明广义差分模型中已无自相关。
最终的模型为
Ln(Y t )= -2.468+0.9060ln(X t )
(3)回归模型为
ln(Yt/Yt-1)=0.054 + 0.4422ln(Xt/Xt-1)
t (4.0569) (6.6979)
R2=0.7137 DW=1.5904
模型中DW = 1.5904> dU,说明广义差分模型中已无自相关。
第七章
7.1 表7.11中给出了1970-1987年期间美国的个人消费支出(PCE)和个人可支配收入(PDI)数据,所有数字的单位都是10亿美元(1982年的美元价)。
表7.11 1970-1987年美国个人消费支出(PCE)和个人可支配收入(PDI)数据
年份 PCE PDI
年份 PCE PDI
年份 PCE PDI
1970 1492.0 1668.1
1971 1538.8 1728.4
1972 1621.9 1797.4
1973 1689.6 1916.3
1974 1674.0 1896.6
1975 1711.9 1931.7
1976 1803.9 2001.0
1977 1883.8 2066.6
1978 1961.0 2167.4
1979 2004.4 2212.6
1980 2000.4 2214.3
1981 2042.2 2248.6
1982 2050.7 2261.5
1983 2146.0 2331.9
1984 2249.3 2469.8
1985 2354.8 2542.8
1986 2455.2 2640.9
1987 2521.0 2686.3
估计下列模型:
(1) 解释这两个回归模型的结果。
(2) 短期和长期边际消费倾向(MPC)是多少?
练习题7.1参考解答:
1)第一个模型回归的估计结果如下,
Dependent Variable: PCE
Method: Least Squares
Date: 07/27/05 Time: 21:41
Sample: 1970 1987
Included observations: 18
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-216.4269
32.69425
-6.619723
0.0000
PDI
1.008106
0.015033
67.05920
0.0000
R-squared
0.996455
Mean dependent var
1955.606
Adjusted R-squared
0.996233
S.D. dependent var
307.7170
S.E. of regression
18.88628
Akaike info criterion
8.819188
Sum squared resid
5707.065
Schwarz criterion
8.918118
Log likelihood
-77.37269
F-statistic
4496.936
Durbin-Watson stat
1.366654
Prob(F-statistic)
0.000000
回归方程:
(32.69425) (0.015033)
t =(-6.619723) (67.05920)
=0.996455 F=4496.936
第二个模型回归的估计结果如下,
Dependent Variable: PCE
Method: Least Squares
Date: 07/27/05 Time: 21:51
Sample (adjusted): 1971 1987
Included observations: 17 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-233.2736
45.55736
-5.120436
0.0002
PDI
0.982382
0.140928
6.970817
0.0000
PCE(-1)
0.037158
0.144026
0.257997
0.8002
R-squared
0.996542
Mean dependent var
1982.876
Adjusted R-squared
0.996048
S.D. dependent var
293.9125
S.E. of regression
18.47783
Akaike info criterion
8.829805
Sum squared resid
4780.022
Schwarz criterion
8.976843
Log likelihood
-72.05335
F-statistic
2017.064
Durbin-Watson stat
1.570195
Prob(F-statistic)
0.000000
回归方程:
(45.557) (0.1409) (0.1440)
t = (-5.120) (6.9708) (0.258)
=0.9965 F=2017.064
2)从模型一得到MPC=1.008;从模型二得到,短期MPC=0.9824,由于模型二为自回归模型,要先转换为分布滞后模型才能得到长期边际消费倾向,我们可以从库伊克变换倒推得到长期MPC=0.9824/(1+0.0372)=0.9472。
7.2 表7.12中给出了某地区1980-2001年固定资产投资Y与销售额X的资料。
表7.12 某地区1980-2001年固定资产投资Y与销售额X的资料(单位:亿元)
年份
Y
X
年份
Y
X
1980
36.99
52.805
1991
128.68
168.129
1981
33.60
55.906
1992
123.97
163.351
1982
35.42
63.027
1993
117.35
172.547
1983
42.35
72.931
1994
139.61
190.682
1984
52.48
84.790
1995
152.88
194.538
1985
53.66
86.589
1996
137.95
194.657
1986
58.53
98.797
1997
141.06
206.326
1987
67.48
113.201
1998
163.45
223.541
1988
78.13
126.905
1999
183.80
232.724
1989
95.13
143.936
2000
192.61
239.459
1990
112.60
154.391
2001
182.81
235.142
运用局部调整假定或自适应预期假定估计以下模型参数,并解释模型的经济意义,探测模型扰动项的一阶自相关性:
1)设定模型
其中为预期最佳值。
2)设定模型
其中为预期最佳值。
3)设定模型
其中为预期最佳值。
练习题7.2参考解答:
1)在局部调整假定下,先估计一阶自回归模型:
回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 25/02/10 Time: 22:42
Sample (adjusted): 1981 2001
Included observations: 21 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-15.10403
4.729450
-3.193613
0.0050
X
0.629273
0.097819
6.433031
0.0000
Y(-1)
0.271676
0.114858
2.365315
0.0294
R-squared
0.987125
Mean dependent var
109.2167
Adjusted R-squared
0.985695
S.D. dependent var
51.78550
S.E. of regression
6.193728
Akaike info criterion
6.616515
Sum squared resid
690.5208
Schwarz criterion
6.765733
Log likelihood
-66.47341
F-statistic
690.0561
Durbin-Watson stat
1.518595
Prob(F-statistic)
0.000000
回归方程:
(4.729450) (0.097819) (0.114858)
t = (-3.193613) (6.433031) (2.365315)
=0.987125 F=690.0561 DW=1.518595
根据局部调整模型的参数关系,有
将上述估计结果代入得到:
故局部调整模型估计结果为:
经济意义:该地区销售额每增加1亿元,未来预期最佳新增固定资产投资为0.864001亿元。
运用德宾h检验一阶自相关:
在显著性水平上,查标准正态分布表得临界值,由于,则接收原假设,说明自回归模型不存在一阶自相关问题。
2)先对数变换模型,有
在局部调整假定下,先估计一阶自回归模型:
回归的估计结果如下,
Dependent Variable: LNY
Method: Least Squares
Date: 25/02/10 Time: 22:55
Sample (adjusted): 1981 2001
Included observations: 21 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1.078046
0.184144
-5.854366
0.0000
LNX
0.904522
0.111243
8.131039
0.0000
LNY(-1)
0.260033
0.087799
2.961684
0.0084
R-squared
0.993725
Mean dependent var
4.559823
Adjusted R-squared
0.993028
S.D. dependent var
0.562953
S.E. of regression
0.047007
Akaike info criterion
-3.145469
Sum squared resid
0.039774
Schwarz criterion
-2.996251
Log likelihood
36.02742
F-statistic
1425.219
Durbin-Watson stat
1.479333
Prob(F-statistic)
0.000000
回归方程:
(0.184144) (0.111243) (0.087799)
t = (-5.854366) (8.131039) (2.961684)
=0.993725 F=1425.219 DW1=1.479333
根据局部调整模型的参数关系,有,,
将上述估计结果代入得到:
故局部调整模型估计结果为:,也即
经济意义:该地区销售额每增加1%,未来预期最佳新增固定资产投资为1.22238%。
运用德宾h检验一阶自相关:
在显著性水平上,查标准正态分布表得临界值,由于,则接收原假设,说明自回归模型不存在一阶自相关。
3)在自适应预期假定下,先估计一阶自回归模型:
回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 25/02/10 Time: 22:42
Sample (adjusted): 1981 2001
Included observations: 21 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-15.10403
4.729450
-3.193613
0.0050
X
0.629273
0.097819
6.433031
0.0000
Y(-1)
0.271676
0.114858
2.365315
0.0294
R-squared
0.987125
Mean dependent var
109.2167
Adjusted R-squared
0.985695
S.D. dependent var
51.78550
S.E. of regression
6.193728
Akaike info criterion
6.616515
Sum squared resid
690.5208
Schwarz criterion
6.765733
Log likelihood
-66.47341
F-statistic
690.0561
Durbin-Watson stat
1.518595
Prob(F-statistic)
0.000000
回归方程:
(4.729450) (0.097819) (0.114858)
t = (-3.193613) (6.433031) (2.365315)
=0.987125 F=690.0561 DW=1.518595
根据局部调整模型的参数关系,有
将上述估计结果代入得到:
故局部调整模型估计结果为:
经济意义:该地区销售额每增加1亿元,未来预期最佳新增固定资产投资为0.864001亿元。
运用德宾h检验一阶自相关:
在显著性水平上,查标准正态分布表得临界值,由于,则接收原假设,说明自回归模型不存在一阶自相关。
7.3 利用表7.12的数据,取阿尔蒙多项式的次数m=2,运用阿尔蒙多项式变换法估计分布滞后模型:
练习题7.3参考解答:
分布滞后模型: s=4,取m=2。
假设,,,, (*)
则模型可变为:,其中:
估计的回归结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 25/02/10 Time: 23:19
Sample (adjusted): 1984 2001
Included observations: 18 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-35.49234
8.192884
-4.332093
0.0007
Z0
0.891012
0.174563
5.104248
0.0002
Z1
-0.669904
0.254447
-2.632783
0.0197
Z2
0.104392
0.062311
1.675338
0.1160
R-squared
0.984670
Mean dependent var
121.2322
Adjusted R-squared
0.981385
S.D. dependent var
45.63348
S.E. of regression
6.226131
Akaike info criterion
6.688517
Sum squared resid
542.7059
Schwarz criterion
6.886378
Log likelihood
-56.19666
F-statistic
299.7429
Durbin-Watson stat
1.130400
Prob(F-statistic)
0.000000
回归方程:
由(*)式可得,
由阿尔蒙多项式变换可得如下估计结果:
7.4 表7.13中给出了1962-1995年某地区基本建设新增固定资产Y和全省工业总产值X按当年价格计算的历史资料。
表7.13 1962-1995年某地区基本建设新增固定资产Y和全省工业总产值X(单位:亿元)
年份
Y
X
年份
Y
X
1962
0.94
4.95
1979
2.06
42.69
1963
1.69
6.63
1980
7.93
51.61
1964
1.78
8.51
1981
8.01
61.5
1965
1.84
9.37
1982
6.64
60.73
1966
4.36
11.23
1983
16
64.64
1967
7.02
11.34
1984
8.81
66.67
1968
5.55
19.9
1985
10.38
73.78
1969
6.93
29.49
1986
6.2
69.52
1970
7.17
36.83
1987
7.97
79.64
1971
2.33
21.19
1988
27.33
92.45
1972
2.18
18.14
1989
12.58
102.94
1973
2.39
19.69
1990
12.47
105.62
1974
3.3
23.88
1991
10.88
104.88
1975
5.24
29.65
1992
17.7
113.3
1976
5.39
40.94
1993
14.72
127.13
1977
1.78
33.08
1994
13.76
141.44
1978
0.73
20.3
1995
14.42
173.75
(1) 设定模型 作局部调整假定,估计参数,并作解释。
(2) 设定模型 作自适应预期假定,估计参数,并作解释。
(3) 比较上述两种模型的设定及拟合情况,你觉得哪一个模型较好,为什么?
练习题7.4参考解答:
1)在局部调整假定下,先估计一阶自回归模型,
回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 07/27/05 Time: 22:31
Sample (adjusted): 1963 1995
Included observations: 33 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.896645
1.167127
1.625055
0.1146
X
0.102199
0.024782
4.123961
0.0003
Y(-1)
0.014700
0.182865
0.080389
0.9365
R-squared
0.584750
Mean dependent var
7.804242
Adjusted R-squared
0.557066
S.D. dependent var
5.889686
S.E. of regression
3.919779
Akaike info criterion
5.656455
Sum squared resid
460.9399
Schwarz criterion
5.792502
Log likelihood
-90.33151
F-statistic
21.12278
Durbin-Watson stat
1.901308
Prob(F-statistic)
0.000002
回归方程:
(1.167)(0.0248) (0.182865)
t =(1.625)(4.1239) (0.080389)
=0.584750 F=21.12278
可以看出,的回归系数显著,而的回归系数不显著,不是很高,模型整体上对样本数据拟合一般。
根据局部调整模型的参数关系,有,将上述估计结果代入得到:
故局部调整模型为:
经济意义:为了达到全省工业总产值的
计划
项目进度计划表范例计划下载计划下载计划下载课程教学计划下载
值,寻求一个未来预期新增固定资产的最佳量。全省工业总产值每计划增加1(亿元),则未来预期最佳新增固定资产量为0.1037亿元。
2)在自适应预期假定下,先估计一阶自回归模型,
回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 07/27/05 Time: 22:31
Sample (adjusted): 1963 1995
Included observations: 33 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.896645
1.167127
1.625055
0.1146
X
0.102199
0.024782
4.123961
0.0003
Y(-1)
0.014700
0.182865
0.080389
0.9365
R-squared
0.584750
Mean dependent var
7.804242
Adjusted R-squared
0.557066
S.D. dependent var
5.889686
S.E. of regression
3.919779
Akaike info criterion
5.656455
Sum squared resid
460.9399
Schwarz criterion
5.792502
Log likelihood
-90.33151
F-statistic
21.12278
Durbin-Watson stat
1.901308
Prob(F-statistic)
0.000002
回归方程:
(1.167)(0.0248) (0.182865)
t =(1.625)(4.1239) (0.080389)
=0.584750 F=21.12278
可以看出,的回归系数显著,而的回归系数不显著,不是很高,模型整体上对样本数据拟合一般。
根据自适应模型的参数关系,有,代入得到:
故局部调整模型为:
经济意义:新增固定资产的变化取决于全省工业总产值的预期值。全省工业总产值每预期增加增加1(亿元),当期新增固定资产量为0.1037(亿元)。
3)局部调整模型和自适应模型的区别在于:局部调整模型是对应变量的局部调整而得到的;而自适应模型是由解释变量的自适应过程而得到的。由回归结果可见,Y滞后一期的回归系数并不显著,说明两个模型的设定都不合理。
7.5 表7.14给出某地区各年末货币流通量Y,社会商品零售额X1、城乡居民储蓄余额X 2的数据。
表7.14 某地区年末货币流通量、社会商品零售额、城乡居民储蓄余额数据(单位:亿元)
年份
年末货币流通量Y
社会商品零售额X1
城乡居民储蓄余额X2
年份
年末货币流通量Y
社会商品零售额X1
城乡居民储蓄余额X2
1953
10518
78676
4163
1970
38500
240332
26156
1954
14088
101433
4888
1971
47100
274534
30944
1955
13375
103989
5689
1972
57200
299197
35961
1956
18354
124525
7406
1973
60000
314006
39667
1957
16867
126467
9156
1974
62500
318954
43320
1958
18515
134446
10193
1975
64500
336015
46184
1959
22558
154961
13939
1976
68000
352924
48311
1960
29036
170370
15495
1977
63000
378115
53313
1961
41472
149182
12553
1978
66000
415830
61290
1962
34826
154564
10080
1979
76000
452032
70033
1963
30000
142548
11602
1980
85000
512543
92800
1964
24300
143415
15031
1981
90000
547956
109707
1965
29300
156998
17108
1982
101000
591088
133799
1966
33900
176387
19301
1983
100000
646427
164314
1967
36100
178162
20485
1984
160000
733162
201199
1968
39600
167074
22572
1985
192000
919045
277185
利用表中数据设定模型:
其中,为长期(或所需求的)货币流通量。试根据局部调整假设,作模型变换,估计并检验参数,对参数经济意义做出解释。
练习题7.5参考解答:
1)在局部调整假定下,先估计一阶自回归模型:
回归的估计结果如下:
Dependent Variable: Y
Method: Least Squares
Date: 26/02/10 Time: 15:56
Sample (adjusted): 1954 1985
Included observations: 32 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
6596.228
4344.078
1.518442
0.1401
X1
0.047451
0.039610
1.197940
0.2410
X2
0.274838
0.090534
3.035736
0.0051
Y(-1)
0.405275
0.187220
2.164699
0.0391
R-squared
0.967247
Mean dependent var
55355.97
Adjusted R-squared
0.963738
S.D. dependent var
40464.90
S.E. of regression
7705.604
Akaike info criterion
20.85375
Sum squared resid
1.66E+09
Schwarz criterion
21.03697
Log likelihood
-329.6600
F-statistic
275.6267
Durbin-Watson stat
2.109534
Prob(F-statistic)
0.000000
回归方程:
(4344.078) (0.039610) (0.090534) (0.187220)
t = (1.518442) (1.197940) (3.035736) (2.164699)
=0.967247 F=275.6267 DW=2.109534
根据局部调整模型的参数关系,有
将上述估计结果代入得到:
故局部调整模型估计结果为:
经济意义:在其他条件不变的情况下,该地区社会商品零售额每增加1亿元,则预期年末货币流通量增加0.07978亿元。同样,在其他条件不变的情况下,该地区城乡居民储蓄余额每增加1亿元,则预期年末货币流通量增加0.462126亿元。
2)先对数变换模型形式,
在局部调整假定下,先估计一阶自回归模型:
回归的估计结果如下:
Dependent Variable: LNY
Method: Least Squares
Date: 26/02/10 Time: 16:12
Sample (adjusted): 1954 1985
Included observations: 32 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.644333
1.677888
0.384014
0.7039
LNX1
0.206230
0.255557
0.806984
0.4265
LNX2
0.180168
0.154913
1.163031
0.2546
LNY(-1)
0.531445
0.109260
4.864049
0.0000
R-squared
0.968959
Mean dependent var
10.70088
Adjusted R-squared
0.965633
S.D. dependent var
0.672279
S.E. of regression
0.124629
Akaike info criterion
-1.210486
Sum squared resid
0.434905
Schwarz criterion
-1.027269
Log likelihood
23.36778
F-statistic
291.3458
Durbin-Watson stat
1.914829
Prob(F-statistic)
0.000000
回归方程:
(1.677888) (0.255557) (0.154913) (0.531445)
t = (0.384014) (0.806984) (1.163013) (4.864049)
=0.968959 F=291.3458 DW=1.914829
根据局部调整模型的参数关系,有
将上述估计结果代入得到:
故局部调整模型估计结果为:
经济意义:货币需求对社会商品零售额的长期弹性为:0.44104;货币需求对城乡居民储蓄余额的长期弹性为0.384518。
7.6 设
其中:M为实际货币流通量,为期望社会商品零售总额,为期望储蓄总额,对于期望值作如下假定:
其中为期望系数,均为小于1的正数。
(1) 如何利用可观测的量来表示?
(2) 分析这样变换存在什么问题?
(3) 利用7.5题的数据进行回归,估计模型,并作检验。
练习题7.6参考解答:
1)首先将M滞后一期并乘上得到
再将原始方程减去该方程,得到
(1)-(2) 于是可表示为:
2)从上面的变化中可看出,随机扰动项变为,这就可能导致出现随机扰动项的自相关,进而导致估计出来的结果是有偏的,而且不是一致估计。
3)对()回归的估计结果如下,
Dependent Variable: MT
Method: Least Squares
Date: 07/26/05 Time: 00:18
Sample(adjusted): 1955 1985
Included observations: 31 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
9266.4908
4918.1374
1.8841
0.0717
Y
0.1323
0.1096
1.2068
0.2392
Y(-1)
-0.1284
0.1236
-1.0389
0.3091
R
-0.3957
0.4883
-0.8104
0.4256
R(-1)
0.9533
0.6612
1.4416
0.1623
MT(-1)
0.4729
0.2361
2.0028
0.0566
MT(-2)
-0.0550
0.2883
-0.1908
0.8502
R-squared
0.9691
Mean dependent var
56687.1935
Adjusted R-squared
0.9614
S.D. dependent var
40415.2055
S.E. of regression
7932.428
Akaike info criterion
20.9909
Sum squared resid
1510162034
Schwarz criterion
21.3147
Log likelihood
-318.3602
F-statistic
125.7918
Durbin-Watson stat
2.1446
Prob(F-statistic)
0
回归方程:
可以看到,只有的回归系数在10% 的显著性水平下是显著的,其他回归系数均不显著;F统计量较大,方程整体显著;较高,模型整体上对样本数据拟合较好。
7.7 考虑如下回归模型:
其中,y为通货膨胀率,x为生产设备使用率。
1) 生产设备使用率对通货膨胀率的短期影响和总的影响分别是多大?
2) 如果库伊克模型为,你怎样得到生产设备使用率对通货膨胀率的短期影响和长期影响?
练习题7.7参考解答:
1)该模型为有限分布滞后模型,故生产设备使用率对通货膨胀的短期影响为0.1408,总的影响为0.1408+0.2306=0.3714。
2)利用工具变量法,用来代替 进行估计,则库伊克模型变换为。若原先有,则需估计的模型为
,所以生产设备使用率对通货膨胀的短期影响为,总的影响为。
7.8 表7.15中给出了某地区消费总额Y和货币收入总额X的年度资料。
表7.15 某地区消费总额Y(亿元)和货币收入总额X(亿元)的年度资料(单位:亿元)
年份
X
Y
年份
X
Y
1975
103.169
91.158
1990
215.539
204.75
1976
115.07
109.1
1991
220.391
218.666
1977
132.21
119.187
1992
235.483
227.425
1978
156.574
143.908
1993
280.975
229.86
1979
166.091
155.192
1994
292.339
244.23
1980
155.099
148.673
1995
278.116
258.363
1981
138.175
151.288
1996
292.654
275.248
1982
146.936
148.1
1997
341.442
299.277
1983
157.7
156.777
1998
401.141
345.47
1984
179.797
168.475
1999
458.567
406.119
1985
195.779
174.737
2000
500.915
462.223
1986
194.858
182.802
2001
450.939
492.662
1987
189.179
180.13
2002
626.709
539.046
1988
199.963
190.444
2003
783.953
617.568
1989
205.717
196.9
2004
890.637
727.397
分析该地区消费同收入的关系
1) 做关于的回归,对回归结果进行分析判断;
2) 建立适当的分布滞后模型,用库伊克变换转换为库伊克模型后进行估计,并对估计结果进行分析判断。
练习题7.8参考解答:
1)做关于的回归,回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 05/03/10 Time: 15:24
Sample: 1975 2004
Included observations: 30
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
27.76594
7.945083
3.494733
0.0016
X
0.807731
0.022840
35.36542
0.0000
R-squared
0.978103
Mean dependent var
262.1725
Adjusted R-squared
0.977321
S.D. dependent var
159.3349
S.E. of regression
23.99515
Akaike info criterion
9.257921
Sum squared resid
16121.49
Schwarz criterion
9.351334
Log likelihood
-136.8688
F-statistic
1250.713
Durbin-Watson stat
1.280986
Prob(F-statistic)
0.000000
回归方程:
(7.945) (0.02284)
t =(3.9447) (35.365)
=0.978103 F=1250.713
从回归结果来看,t检验值、F检验值及都显著,但在显著性水平上,DW值,说明模型扰动项存在正自相关,需对模型进行修改。
2)事实上,当年消费不仅受当年收入的影响,而且还受过去各年收入水平的影响,因此,我们在上述模型中增添货币收入总额X的滞后变量进行分析。如前所述,对分布滞后模型直接进行估计会存在自由度损失和多重共线性等问题。在此,选择库伊克模型进行回归分析,即估计如下模型:
回归的估计结果如下,
Dependent Variable: Y
Method: Least Squares
Date: 05/03/10 Time: 15:31
Sample (adjusted): 1976 2004
Included observations: 29 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-6.905686
4.179931
-1.652105
0.1105
X
0.251865
0.043638
5.771717
0.0000
Y(-1)
0.813628
0.062991
12.91657
0.0000
R-squared
0.997002
Mean dependent var
268.0696
Adjusted R-squared
0.996772
S.D. dependent var
158.7886
S.E. of regression
9.021969
Akaike info criterion
7.334900
Sum squared resid
2116.294
Schwarz criterion
7.476344
Log likelihood
-103.3560
F-statistic
4323.744
Durbin-Watson stat
1.215935
Prob(F-statistic)
0.000000
回归结果显示,t检验值、F检验值及都显著,但
在显著性水平上,查标准正态分布表得临界值,由于,则拒绝原假设,说明自回归模型存在一阶自相关,需对模型作进一步修改。