计量经济学全部答案(庞浩)第二版
第二章练习题及参考解答
2.1 为研究中国的货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相互依存关系,分析表中1990年—2007年中国货币供应量(M2)和国内生产总值(GDP)的有关数据:
表2.9 1990年—2007年中国货币供应量和国内生产总值(单位:亿元)
年份
货币供应量M2
国内生产总值GDP
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
15293.4
19349.9
25402.2
34879.8
46923.5
60750.5
76094.9
90995.3
104498.5
119897.9
134610.4
158301.9
185007.0
221222.8
254107.0
298755.7
345603.6
403442.2
18718.3
21826.2
26937.3
35260.0
48108.5
59810.5
70142.5
78060.8
83024.3
88479.2
98000.5
108068.2
119095.7
135174.0
159586.7
184088.6
213131.7
251483.2
资料来源:中国统计年鉴2008,中国统计出版社
对货币供应量与国内生产总值作相关分析,并说明相关分析结果的经济意义。
练习题2.1 参考解答:
计算中国货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相关系数为:
计算方法:
或
计算结果:
M2
GDP
M2
1
0.996426148646
GDP
0.996426148646
1
经济意义: 这说明中国货币供应量与国内生产总值(GDP)的线性相关系数为0.996426,线性相关程度相当高。
2.2 为研究美国软饮料公司的广告费用X与销售数量Y的关系,分析七种主要品牌软饮料公司的有关数据
表2.10 美国软饮料公司广告费用与销售数量
品牌名称
广告费用X(百万美元)
销售数量Y(百万箱)
Coca-Cola Classic
131.3
1929.2
Pepsi-Cola
92.4
1384.6
Diet-Coke
60.4
811.4
Sprite
55.7
541.5
Dr.Pepper
40.2
546.9
Moutain Dew
29.0
535.6
7-Up
11.6
219.5
资料来源:(美) Anderson D R等. 商务与经济统计.机械工业出版社.1998. 405
绘制美国软饮料公司广告费用与销售数量的相关图, 并计算相关系数,分析其相关程度。能否在此基础上建立回归模型作回归分析?
练习题2.2参考解答
美国软饮料公司的广告费用X与销售数量Y的散点图为
说明美国软饮料公司的广告费用X与销售数量Y正线性相关。
相关系数为:
x
y
x
1
0.978148015384
y
0.978148015384
1
说明美国软饮料公司的广告费用X与销售数量Y的正相关程度相当高。
若以销售数量Y为被解释变量,以广告费用X为解释变量,可建立线性回归模型
利用EViews估计其参数结果为
经t检验表明, 广告费用X对美国软饮料公司的销售数量Y确有显著影响。回归结果表明,广告费用X每增加1百万美元, 平均说来软饮料公司的销售数量将增加14.40359(百万箱)。
2.3 为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:
表2.11 深圳市地方预算内财政收入与国内生产总值
年 份
地方预算内财政收入Y
(亿元)
本市生产总值(GDP)X
(亿元)
1990
21.70
171.67
1991
27.33
236.66
1992
42.96
317.32
1993
67.25
453.14
1994
74.40.
634.67
1995
88.02
842.48
1996
131.75
1048.44
1997
142.06
1297.42
1998
164.39
1534.73
1999
184.21
1804.02
2000
221.92
2187.45
2001
262.49
2482.49
2002
265.93
2969.52
2003
290.84
3585.72
2004
321.47
4282.14
2005
421.38
4950.91
2006
500.88
5813.56
2007
658.06
6801.57
资料来源: 深圳市统计年鉴2008. 中国统计出版社
(1)建立深圳地方预算内财政收入对本市生产总值GDP的回归模型;
(2)估计所建立模型的参数,解释斜率系数的经济意义;
(3)对回归结果进行检验。
(4)若是2008年深圳市的本市生产总值为8000亿元,试对 2008年深圳市的财政收入作出点预测和区间预测 (
)。
练习题2.3参考解答:
建立深圳地方预算内财政收入对GDP的回归模型,建立EViews文件,利用地方预算内财政收入(Y)和GDP的数据表,作散点图
可看出地方预算内财政收入(Y)和GDP的关系近似直线关系,可建立线性回归模型:
利用EViews估计其参数结果为
即
(9.8674) (0.0033)
t=(2.0736) (26.1038)
R2=0.9771 F=681.4064
经检验说明,深圳市的GDP对地方财政收入确有显著影响。
,说明GDP解释了地方财政收入变动的近98%,模型拟合程度较好。
模型说明当GDP 每增长1亿元时,平均说来地方财政收入将增长0.0850亿元。
当2008年GDP 为7500亿元时,地方财政收入的点预测值为:
(亿元)
区间预测:
为了作区间预测,取
,
平均值置信度95%的预测区间为:
利用EViews由GDP数据的统计量得到
n=18
则有
取
,
,
平均值置信度95%的预测区间为:
时
(亿元)
个别值置信度95%的预测区间为:
即
(亿元)
2.4 为研究中国改革开放以来国民总收入与最终消费的关系,搜集到以下数据:
表2.12 中国国民总收入与最终消费 (单位:亿元)
年份
国民总收入X
最终消费
Y
年份
国民总收入
X
最终消费
Y
1978
3645.217
2239.1
1993
35260.02
21899.9
1979
4062.579
2633.7
1994
48108.46
29242.2
1980
4545.624
3007.9
1995
59810.53
36748.2
1981
4889.461
3361.5
1996
70142.49
43919.5
1982
5330.451
3714.8
1997
78060.83
48140.6
1983
5985.552
4126.4
1998
83024.28
51588.2
1984
7243.752
4846.3
1999
88479.15
55636.9
1985
9040.737
5986.3
2000
98000.45
61516
1986
10274.38
6821.8
2001
108068.2
66878.3
1987
12050.62
7804.6
2002
119095.7
71691.2
1988
15036.82
9839.5
2003
135174
77449.5
1989
17000.92
11164.2
2004
159586.7
87032.9
1990
18718.32
12090.5
2005
184088.6
97822.7
1991
21826.2
14091.9
2006
213131.7
110595.3
1992
26937.28
17203.3
2007
251483.2
128444.6
资料来源:中国统计年鉴2008. 中国统计出版社,2008.
以分析国民总收入对消费的推动作用为目的,建立线性回归方程,并估计其参数。
计算回归估计的标准误差
和可决系数
。
对回归系数进行显著性水平为5%的显著性检验。
如果2008年全年国民总收入为300670亿元,比上年增长9.0%,预测可能达到的最终
消费水平,并对最终消费的均值给出置信度为95%的预测区间。
练习题2.4参考解答:
(1)以最终消费为被解释变量Y,以国民总收入为解释变量X,建立线性回归模型:
利用EViews估计参数并检验
回归分析结果为:
(895.4040) (0.00967)
t= (3.3999) (54.8208)
n=30
(2)回归估计的标准误差即估计的随机扰动项的标准误差
,由EViews估计参数和检验结果得
, 可决系数为0.9908。
(3)由t分布表可查得
,由于
,或由P值=0.000可以看出, 对回归系数进行显著性水平为5%的显著性检验表明, 国民总收入对最终消费有显著影响。
(4)如果2008年全年国民总收入为300670亿元,预测可能达到的最终消费水平为:
(亿元)
对最终消费的均值置信度为95%的预测区间为:
由Eviews计算国民总收入X变量样本数据的统计量得:
n=30
则有
取
,
,
,已知
,平均值置信度95%的预测区间为:
=
=
(亿元)
2.5 美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下
。
表2.13 美国各航空公司业绩的统计数据
航空公司名称
航班正点率(%)
投诉率(次/10万名乘客)
西南(Southwest)航空公司
81.8
0.21
大陆(Continental)航空公司
76.6
0.58
西北(Northwest)航空公司
76.6
0.85
美国(US Airways)航空公司
75.7
0.68
联合(United)航空公司
73.8
0.74
美洲(American)航空公司
72.2
0.93
德尔塔(Delta)航空公司
71.2
0.72
美国西部(Americawest)航空公司
70.8
1.22
环球(TWA)航空公司
68.5
1.25
资料来源:(美) Anderson D R等.商务与经济统计. 机械工业出版社.1998,405.
(1)画出这些数据的散点图
(2)根据散点图。表明二变量之间存在什么关系?
(3)估计描述投诉率如何依赖航班按时到达正点率的回归方程。
(4)对估计的回归方程斜率的意义作出解释。
(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?
练习题2.5参考解答:
美国各航空公司航班正点到达比率X和每10万名乘客投诉次数Y的散点图为
由图形看出航班正点到达比率和每10万名乘客投诉次数呈现负相关关系,
利用EViews计算线性相关系数为:
X
Y
X
1
-0.882607
Y
-0.882607
建立描述投诉率(Y)依赖航班按时到达正点率(X)的回归方程:
利用EViews估计其参数结果为
即
(1.017832)(-0.014176)
t=(5.718961) (-4.967254)
R2=0.778996 F=24.67361
从检验结果可以看出, 航班正点到达比率对乘客投诉次数确有显著影响。
这说明当航班正点到达比率每提1个百分点, 平均说来每10万名乘客投诉次数将下降0.07次。
如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数为
(次)
2.6 表2.34中是16支公益股票某年的每股帐面价值Y和当年红利X的数据:
表2.14 某年16支公益股票每股帐面价值和当年红利
公司序号
帐面价值Y(元)
红利X(元)
公司序号
帐面价值Y(元)
红利X(元)
1
22.44
2.4
9
12.14
0.80
2
20.89
2.98
10
23.31
1.94
3
22.09
2.06
11
16.23
3.00
4
14.48
1.09
12
0.56
0.28
5
20.73
1.96
13
0.84
0.84
6
7
8
19.25
20.37
26.43
1.55
2.16
1.60
14
15
16
18.05
12.45
11.33
1.80
1.21
1.07
(1)分析每股帐面价值和当年红利的相关性?
(2) 建立每股帐面价值和当年红利的回归方程;
(3)解释回归系数的经济意义。
练习题2.6参考解答:
1.分析每股帐面价值和当年红利的相关性
作散布图:
从图形看似乎具有一定正相关性,计算相关系数:
每股帐面价值和当年红利的相关系数为0.708647
2.建立每股帐面价值X和当年红利Y的回归方程:
回归结果:
参数
的t检验:t值为3.7580,查表
<
,或者P值为0.0021<
,表明每股红利对帐面价值有显著的影响。
3.回归系数的经济意义:
平均说来公司的股票每股红利增加1元,当年帐面价值将增加6.8942元
2.7 设销售收入X为解释变量,销售成本Y为被解释变量。现已根据某百货公司某年12个月的有关资料计算出以下数据:(单位:万元)
拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。
计算可决系数和回归估计的标准误差。
对
进行显著水平为5%的显著性检验。
假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置信度为95%的预测区间。
练习题2.7参考解答:
(1)建立回归模型:
用OLS法估计参数:
估计结果为:
说明该百货公司销售收入每增加1元,平均说来销售成本将增加0.7863元。
(2)计算可决系数和回归估计的标准误差
可决系数为:
由
可得
回归估计的标准误差:
(3) 对
进行显著水平为5%的显著性检验
查表得
时,
<
表明
显著不为0,销售收入对销售成本有显著影响.
假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置信度为95%的预测区间。
万元
预测区间为:
2.8 表2.15中是1992年亚洲各国人均寿命(Y)、按购买力平价计算的人均GDP(X1)、成人识字率(X2)、一岁儿童疫苗接种率(X3)的数据:
表2.15 1992年亚洲各国人均寿命等数据
序号
国家和
地区
平均寿命
Y (年)
人均GDP
X1(100美元)
成人识字率X2(%)
一岁儿童疫苗接种率X3 (%)
1
日本
79
194
99
99
2
中国香港
77
185
90
79
3
韩国
70
83
97
83
4
新加坡
74
147
92
90
5
泰国
69
53
94
86
6
马来西亚
70
74
80
90
7
斯里兰卡
71
27
89
88
8
中国大陆
70
29
80
94
9
菲律宾
65
24
90
92
10
朝鲜
71
18
95
96
11
蒙古
63
23
95
85
12
印度尼西亚
62
27
84
92
13
越南
63
13
89
90
14
缅甸
57
7
81
74
15
巴基斯坦
58
20
36
81
16
老挝
50
18
55
36
17
印度
60
12
50
90
18
孟加拉国
52
12
37
69
19
柬埔寨
50
13
38
37
20
尼泊尔
53
11
27
73
21
不丹
48
6
41
85
22
阿富汗
43
7
32
35
资料来源:联合国发展规划署. 人的发展报告. 1993
(1)分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系。
(2)对所建立的多个回归模型进行检验。
(3)分析对比各个简单线性回归模型。
练习题2.8参考解答:
分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系:
人均寿命与人均GDP关系
估计检验结果:
人均寿命与成人识字率关系
人均寿命与一岁儿童疫苗接种率关系
(2)对所建立的多个回归模型进行检验
由人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命回归结果的参数t检验值均明确大于其临界值,而且从对应的P值看,均小于0.05,所以人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命都有显著影响.
(3)分析对比各个简单线性回归模型
人均寿命与人均GDP回归的可决系数为0.5261
人均寿命与成人识字率回归的可决系数为0.7168
人均寿命与一岁儿童疫苗接种率的可决系数为0.5379
相对说来,人均寿命由成人识字率作出解释的比重更大一些
2.9 按照“弗里德曼的持久收入假说”: 持久消费
正比于持久收入
,依此假说建立的计量模型没有截距项,设定的模型应该为:
,这是一个过原点的回归。在古典假定满足时,证明过原点的回归中
的OLS估计量
的计算公式是什么?对该模型是否仍有
和
?对比有截距项模型和无截距项模型参数的OLS估计有什么不同?
练习题2.9参考解答:
没有截距项的过原点回归模型为:
因为
求偏导
令
得
而有截距项的回归为
对于过原点的回归,由OLS原则:
已不再成立, 但是
是成立的。
还可以证明对于过原点的回归
,
而有截距项的回归为
,
2.10 练习题2.3中如果将“地方财政收入”和“本市生产总值”数据的计量单位分别或同时由”亿元”改为”万元”,重新估计参数,对比参数估计及检验结果与计量单位更改之前有什么区别? 你能从中
总结
初级经济法重点总结下载党员个人总结TXt高中句型全总结.doc高中句型全总结.doc理论力学知识点总结pdf
出什么规律性吗?
练习题2.10参考解答:
如果将“地方财政收入Y”和“本市生产总值GDP”数据的计量单位分别或同时由”亿元”改为”万元”,数据变为:
深圳市地方预算内财政收入与国内生产总值
年 份
地方预算内财政收入Y
本市生产总值(GDP)
(亿元)Y1
(万元)Y2
(亿元)GDP1
(万元)
GDP2
1990
21.70
217000
171.67
1716700
1991
27.33
273300
236.66
2366600
1992
42.96
429600
317.32
3173200
1993
67.25
672500
453.14
4531400
1994
74.40.
744000
634.67
6346700
1995
88.02
880200
842.48
8424800
1996
131.75
1317500
1048.44
10484400
1997
142.06
1420600
1297.42
12974200
1998
164.39
1643900
1534.73
15347300
1999
184.21
1842100
1804.02
18040200
2000
221.92
2219200
2187.45
21874500
2001
262.49
2624900
2482.49
24824900
2002
265.93
2659300
2969.52
29695200
2003
290.84
2908400
3585.72
35857200
2004
321.47
3214700
4282.14
42821400
2005
421.38
4213800
4950.91
49509100
2006
500.88
5008800
5813.56
58135600
2007
658.06
6580600
6801.57
68015700
A.当“地方财政收入”和“本市生产总值”数据的计量单位均为“亿元”时估计检验结果为:
(9.867440) (0.003255)
t=(2.073593) (26.10376) R2=0.977058
B.当“地方财政收入” 的计量单位为“亿元”,“本市生产总值” 的计量单位为“万元”
时:
(9.867440)(0.000000325)
t=(2.073593) (26.10376) R2=0.977058
C.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“亿元”
时:
(98674.40) (32.54902)
t=(2.073593) (26.10376) R2=0.977058
D.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“万元”
时:
(98674.40) (0.0032549)
t=(2.073593) (26.10376) R2=0.977058
可以总结出,变量度量单位对回归影响的一般规律为:
1)当被解释变量测量单位改变(扩大或缩小常数c倍),而解释变量测量单位不变时:OLS截距和斜率的估计值及标准误差都缩小或扩大为原来的c倍. (如C的情况)
2)当解释变量测量单位改变(扩大或缩小常数c倍),而被解释变量测量单位不变时:OLS斜率的估计值及标准误差扩大或缩小为原来的c倍,但不影响截距的估计. (如B的情况)
3)当被解释变量和解释变量测量单位同时改变相同倍数时,OLS的截距估计值及标准误差扩大为原来的c倍,但不影响斜率的估计. (如D的情况)
4)当被解释变量和解释变量测量单位改变时,不会影响拟合优度.可决系数是纯数没有维度,所以不随计量单位而变化。
第三章练习题参考解答
练习题
3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下:
t=(-3.066806) (6.652983) (3.378064)
R2=0.934331
F=191.1894 n=31
从经济意义上考察估计模型的合理性。
在5%显著性水平上,分别检验参数
的显著性。
在5%显著性水平上,检验模型的整体显著性。
3.2根据下列数据试估计偏回归系数、标准误差,以及可决系数与修正的可决系数:
,
,
,
,
,
,
,
,
,
3.3 经研究发现,家庭书刊消费受家庭收入几户主受教育年数的影响,表中为对某地区部分家庭抽样调查得到样本数据:
家庭书刊年消费支出(元)Y
家庭月平均收入
(元)X
户主受教育年数
(年)T
家庭书刊年消费支出(元)Y
家庭月平均收入
(元)X
户主受教育年数
(年)T
450
1027.2
8
793.2
1998.6
14
507.7
1045.2
9
660.8
2196
10
613.9
1225.8
12
792.7
2105.4
12
563.4
1312.2
9
580.8
2147.4
8
501.5
1316.4
7
612.7
2154
10
781.5
1442.4
15
890.8
2231.4
14
541.8
1641
9
1121
2611.8
18
611.1
1768.8
10
1094.2
3143.4
16
1222.1
1981.2
18
1253
3624.6
20
(1) 建立家庭书刊消费的计量经济模型;
(2)利用样本数据估计模型的参数;
(3)检验户主受教育年数对家庭书刊消费是否有显著影响;
(4)分析所估计模型的经济意义和作用
3.4 考虑以下“期望扩充菲利普斯曲线(Expectations-augmented Phillips curve)”模型:
其中:
=实际通货膨胀率(%);
=失业率(%);
=预期的通货膨胀率(%)
下表为某国的有关数据,
表1. 1970-1982年某国实际通货膨胀率Y(%),
失业率X2(%)和预期通货膨胀率X3(%)
年份
实际通货膨胀率Y
(%)
失业率X2
(%)
预期的通货膨胀率X3(%)
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
5.92
4.30
3.30
6.23
10.97
9.14
5.77
6.45
7.60
11.47
13.46
10.24
5.99
4.90
5.90
5.60
4.90
5.60
8.50
7.70
7.10
6.10
5.80
7.10
7.60
9.70
4.78
3.84
3.31
3.44
6.84
9.47
6.51
5.92
6.08
8.09
10.01
10.81
8.00
(1)对此模型作估计,并作出经济学和计量经济学的说明。
(2)根据此模型所估计结果,作计量经济学的检验。
(3)计算修正的可决系数(写出详细计算过程)。
3.5某地区城镇居民人均全年耐用消费品支出、人均年可支配收入及耐用消费品价格指数的统计资料如表所示:
年份
人均耐用消费品支出
Y(元)
人均年可支配收入
X1(元)
耐用消费品价格指数
X2(1990年=100)
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
137.16
124.56
107.91
102.96
125.24
162.45
217.43
253.42
251.07
285.85
327.26
1181.4
1375.7
1501.2
1700.6
2026.6
2577.4
3496.2
4283.0
4838.9
5160.3
5425.1
115.96
133.35
128.21
124.85
122.49
129.86
139.52
140.44
139.12
133.35
126.39
利用表中数据,建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型,进行回归分析,并检验人均年可支配收入及耐用消费品价格指数对城镇居民人均全年耐用消费品支出是否有显著影响。
3.6下表给出的是1960—1982年间7个OECD国家的能源需求指数(Y)、实际GDP指数(X1)、能源价格指数(X2)的数据,所有指数均以1970年为基准(1970=100)
年份
能源需求指数Y
实际GDP指数X1
能源价格指数X2
年份
能源需求指数Y
实际GDP指数X1
能源价格指数X2
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
54.1
55.4
58.5
61.7
63.6
66.8
70.3
73.5
78.3
83.3
88.9
91.8
54.1
56.4
59.4
62.1
65.9
69.5
73.2
75.7
79.9
83.8
86.2
89.8
111.9
112.4
111.1
110.2
109.0
108.3
105.3
105.4
104.3
101.7
97.7
100.3
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
97.2
100.0
97.3
93.5
99.1
100.9
103.9
106.9
101.2
98.1
95.6
94.3
100.0
101.4
100.5
105.3
109.9
114.4
118.3
119.6
121.1
120.6
98.6
100.0
120.1
131.0
129.6
137.7
133.7
144.5
179.0
189.4
190.9
(1)建立能源需求与收入和价格之间的对数需求函数
,解释各回归系数的意义,用P值检验所估计回归系数是否显著。
(2) 再建立能源需求与收入和价格之间的线性回归模型
,解释各回归系数的意义,用P值检验所估计回归系数是否显著。
(3 )比较所建立的两个模型,如果两个模型结论不同,你将选择哪个模型,为什么?
练习题参考解答
练习题3.1参考解答
有模型估计结果可看出:旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数增加1万人次,旅游外汇收入增加1.5452百万美元。
取
,查表得
因为3个参数t统计量的绝对值均大于
,说明经t检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。
取
,查表得
,由于
,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。
练习题3.3参考解答
(1)建立家庭书刊消费的计量经济模型:
其中:Y为家庭书刊年消费支出、X为家庭月平均收入、T为户主受教育年数
(2)估计模型参数,结果为
即
(49.46026)(0.02936) (5.20217)
t= (-1.011244) (2.944186) (10.06702)
R2=0.951235
F=146.2974
(3) 检验户主受教育年数对家庭书刊消费是否有显著影响:
由估计检验结果, 户主受教育年数参数对应的t 统计量为10.06702, 明显大于t的临界值
,同时户主受教育年数参数所对应的P值为0.0000,明显小于
,均可判断户主受教育年数对家庭书刊消费支出确实有显著影响。
(4)本模型说明家庭月平均收入和户主受教育年数对家庭书刊消费支出有显著影响,家庭月平均收入增加1元,家庭书刊年消费支出将增加0.086元,户主受教育年数增加1年,家庭书刊年消费支出将增加52.37元。
练习题3.5参考解答
(1) 建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型:
(2)估计参数结果
由估计和检验结果可看出,该地区人均年可支配收入的参数的t检验值为10.54786,其绝对值大于临界值
;而且对应的P值为0.0000,也明显小于
。说明人均年可支配收入对该地区城镇居民人均全年耐用消费品支出确实有显著影响。
但是,该地区耐用消费品价格指数的参数的t检验值为-0.921316,其绝对值小于临界值
;而且对应的P值为0.3838,也明显大于
。这说明该地区耐用消费品价格指数对城镇居民人均全年耐用消费品支出并没有显著影响。
第四章
4.1 假设在模型
中,
之间的相关系数为零,于是有人建议你进行如下回归:
(1)是否存在
?为什么?
(2)
(3)是否有
?
练习题4.1参考解答:
(1) 存在
。
因为
当
之间的相关系数为零时,离差形式的
有
同理有:
(2)
因为
,且
,
由于
,则
则
(3) 存在
。
因为
当
时,
同理,有
4.2在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而作出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么?
练习题4.2参考解答:
根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不能反映引进新的解释变量后的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某个解释变量被剔出就再也没有机会重新进入方程。而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而呈现出不同,所以要寻找到“最优”变量子集则采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。
4.3 下表给出了中国商品进口额Y、国内生产总值GDP、居民消费价格指数CPI。
表4.11 中国商品进口额、国内生产总值、居民消费价格指数
年份
商品进口额
(亿元)
国内生产总值
(亿元)
居民消费价格指数(1985=100)
1985
1257.8
9016.0
100.0
1986
1498.3
10275.2
106.5
1987
1614.2
12058.6
114.3
1988
2055.1
15042.8
135.8
1989
2199.9
16992.3
160.2
1990
2574.3
18667.8
165.2
1991
3398.7
21781.5
170.8
1992
4443.3
26923.5
181.7
1993
5986.2
35333.9
208.4
1994
9960.1
48197.9
258.6
1995
11048.1
60793.7
302.8
1996
11557.4
71176.6
327.9
1997
11806.5
78973.0
337.1
1998
11626.1
84402.3
334.4
1999
13736.4
89677.1
329.7
2000
18638.8
99214.6
331.0
2001
20159.2
109655.2
333.3
2002
24430.3
120332.7
330.6
2003
34195.6
135822.8
334.6
2004
46435.8
159878.3
347.7
2005
54273.7
183084.8
353.9
2006
63376.9
211923.5
359.2
2007
73284.6
249529.9
376.5
资料来源:《中国统计年鉴》,中国统计出版社2000年、2008年。
请考虑下列模型:
1)利用表中数据估计此模型的参数。
2)你认为数据中有多重共线性吗?
3)进行以下回归:
根据这些回归你能对数据中多重共线性的性质说些什么?
4)假设数据有多重共线性,但
在5%水平上个别地显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?
练习题4.3参考解答:
参数估计结果如下
(括号内为标准误)
(2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且且CPI与进口之间的简单相关系数呈现正向变动。可能数据中有多重共线性。
计算相关系数:
(3)最大的CI=108.812,表明GDP与CPI之间存在较高的线性相关。
(4)分别拟合的回归模型如下:
单方程拟合效果都很好,回归系数显著,可决系数较高,GDP和CPI对进口分别有显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。
(5)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意。
4.4 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现?
练习题4.4参考解答:
本题很灵活,主要应注意以下问题:
(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。
(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。
4.5 克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:
括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析,指出其中存在的问题。
练习题4.5参考解答:
从模型拟合结果可知,样本观测个数为27,消费模型的判定系数
,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。
依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值:
除
外,其余的
值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。
另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。
4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值 (亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2007年期间的统计数据,具体如表4.2所示。
表4.12 1985~2007年统计数据
年份
能源消费
国民
总收入
国内生
产总值
工业
增加值
建筑业
增加值
交通运输邮电
增加值
人均生活
电力消费
能源加工
转换效率
y
X1
X2
X3
X4
X5
X6
X7
1985
76682
9040.7
9016
3448.7
417.9
406.9
21.3
68.29
1986
80850
10274.4
10275.2
3967
525.7
475.6
23.2
68.32
1987
86632
12050.6
12058.6
4585.8
665.8
544.9
26.4
67.48
1988
92997
15036.8
15042.8
5777.2
810
661
31.2
66.54
1989
96934
17000.9
16992.3
6484
794
786
35.3
66.51
1990
98703
18718.3
18667.8
6858
859.4
1147.5
42.4
67.2
1991
103783
21826.2
21781.5
8087.1
1015.1
1409.7
46.9
65.9
1992
109170
26937.3
26923.5
10284.5
1415
1681.8
54.6
66.00
1993
115993
35260
35333.9
14188
2266.5
2205.6
61.2
67.32
1994
122737
48108.5
48197.9
19480.7
2964.7
2898.3
72.7
65.2
1995
131176
59810.5
60793.7
24950.6
3728.8
3424.1
83.5
71.05
1996
138948
70142.5
71176.6
29447.6
4387.4
4068.5
93.1
71.5
1997
137798
77653.1
78973
32921.4
4621.6
4593
101.8
69.23
1998
132214
83024.3
84402.3
34018.4
4985.8
5178.4
106.6
69.44
1999
133831
88189
89677.1
35861.5
5172.1
5821.8
118.2
69.19
2000
138553
98000.5
99214.6
4003.6
5522.3
7333.4
132.4
69.04
2001
143199
108068.2
109655.2
43580.6
5931.7
8406.1
144.6
69.03
2002
151797
119095.7
120332.7
47431.3
6465.5
9393.4
156.3
69.04
2003
174990
135174
135822.8
54945.5
7490.8
10098.4
173.7
69.4
2004
203227
159586.7
159878.3
65210
8694.3
12147.6
190.2
70.71
2005
223319
183956.1
183084.8
76912.9
10133.8
10526.1
216.7
71.08
2006
246270
213131.7
211923.5
91310.9
11851.1
12481.1
249.4
71.24
2007
265583
251483.2
249529.9
107367.2
14014.1
14604.1
274.9
71.25
资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。
要求:
1)建立对数多元线性回归模型,分析回归结果。
2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?
3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。
练习题4.6参考解答:
(1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下:
生成: lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7.
作全部变量对数线性多元回归,结果为:
从修正的可决系数和F统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,,各变量联合起来对能源消费影响显著。可是其中的lnX3、lnX4、lnX6对lnY影响不显著,而且lnX2、lnX5的参数为负值,在经济意义上不合理。所