计量经济学课程论文
我国私家车拥有量影响因素的计量分析
我国私家车拥有量影响因素的计量分析
一.问题的提出
私家车,私人自己买的,拥有使用支配权的,在不违法的情况下可以自由的使用支配。2013年,私家车取消了以前15年必须报废的规定,改为60万公里引导报废。
随着我国经济实力的增强,人民生活水平的提高,私人汽车的需求量也是逐年增加。尤其是2002年以来,私人购车占整个市场的份额迅速提升,汽车市场进入私人购车阶段。根据国际通用车价和国内生产总值增长比较系数计算,未来5~10年中国有购车能力的人口可达5亿,约1.5亿个家庭。未来20年中国有望成为全球第一大汽车市场。而且全世界范围内千人汽车保有量128辆,按照6月末中国的汽车保有量测算,中国千人汽车保有量大约为63辆,相当于世界平均水平一半。由于中国人多地少的基本国情,如此低的汽车保有量,已经给城市交通和环境带来巨大压力。交通拥堵、空气污染已经成为国内许多城市挥之不去的梦魇,汽车对能源消耗和环境的影响也越来越大。继北京对汽车实行限购限行措施后,国内还有一些城市也准备采取相关措施,缓解交通拥堵。在一些大城市,汽车过快增长和道路不足的矛盾越来越突出。正因为私人汽车逐渐占据了汽车消费市场的主导地位又引发诸多矛盾,并直接反映了整个汽车行业的现状,所以私人汽车消费市场越来越吸引人们的关注。
二.理论综述
多重共线性:所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。一般多重共线性的修正都是采用逐步回归法来解决,具体步骤如下:先用被解释变量对每一个所考虑的解释变量做简单回归,然后以对被解释变量贡献最大的解释变量所对应的回归方程基础,再逐个引入其余的解释变量。这个过程中会出现3种情形:①若新变量的引入改进了adjustR^2和F检验,且其他回归参数的t检验在统计上仍是显著的,则可考虑在模型中保留该变量。②若新变量的引入未能明显改进adjustR^2和F检验,且对其他回归参数估计值t检验也未带来什么影响,则认为该变量是多余的。③若新变量的引入未能明显改进adjustR^2和F检验,则
说明
关于失联党员情况说明岗位说明总经理岗位说明书会计岗位说明书行政主管岗位说明书
出现了严重的多重共线性。经过对各个引入新变量模型多方面的综合比较,保留adjustR^2改进最大,且不影响原有变量的显著性。经逐步回归,使得最后留在模型中解释的变量即使重要的,又没有严重的多重共线性。
异方差性(heteroscedasticity ):是相对于同方差而言的。所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。
若线性回归模型存在异方差性,则用传统的最小二乘法估计模型,得到的参数估计不是有效估计量,甚至也不是渐近有效的估计量;此时也无法对模型参数的进行有关显著性检验。
对存在异方差性的模型可以采用加权最小二乘法进行估计。
异方差性的检测——White test
在此检测中,原假设为:回归方程的随机误差满足同方差性。对立假设为:回归方程的随机误差满足异方差性。判断原则为:如果nR^2>chi^2 (k-1),则原假设就要被否定,即回归方程满足异方差性。
在以上的判断式中,n代表样本数量,k代表参数数量,k-1代表自由度。chi^2值可由查表所得。
自相关(auto correlation):又称为序列相关,实际中,如果变量在时间或空间的顺序有一定含义,就有可能存在序列相关,特别是在时间序列数据的研究中,数据的观测值往往是按照时间的先后自然排列,因此连续观测的时间序列数据就表现出内在的相关性,是指总体回归模型的随机误差项
之间存在相关关系。
三.模型设定
由于非线性模型的假设检验都涉及到非常复杂的数学计算,所以本文考虑做一个线性模型(对参数线性),这样各种检验的方法较多,对模型准确程度的分析也更可靠。
1. 变量选择
(1)城镇家庭人均可支配收入
私家车这种高档消费品的拥有量显然与收入水平有关,因此引进解释变量人均可支配收入,并先预期此二因素与私家车拥有量呈正相关。 (2)公路里程
本文预计私家车的拥有量与全国公路里程有关,因此引入解释变量公路里程,并预期其与私人汽车拥有量成正相关。
(2)全国公路里程 (万公里)
本文预计私家车的拥有量与全国公路里程有关,因此引入解释变量公路里程,并预期其与私人汽车拥有量成正相关。
(3)全国汽车产量 (万辆)
本文预计私家车的拥有量与全国汽车产量有关,因此引入解释变量全国汽车产量,并预期其与私人汽车拥有量成正相关。
(4)城镇人口(万人)
本文预计私家车的拥有量与城镇人口数有关,城镇人口数促进汽车销售,因此引入解释变量城镇人口数,并预期其与私人汽车拥有量成正相关。
2. 模型形式的设计
预计城镇人口数与私人汽车拥有量呈正相关,城镇家庭人均可支配收入、全国汽车产量及全国公路里程都与私人汽车拥有量呈正相关。
通过对数据观察,根据搜集的1981年至2010年的统计数据,建立模型。其模型表达式为:
Y=
+
+
+
+
+
(i=1,2,3,4)
其中:Y表示私人汽车拥有量,
表示在不变情况下,私家车的固有量,X1表示城镇人口数(万人),X2表示城镇家庭人均可支配收入,X3表示全国汽车产量(万辆),X4表示全国公路里程(万公里),
表示各因素对Y的影响权数,μi表示随机误差项,并将这些变量引入模型中。
四.数据的收集
本文获取了1988年到2010的数据如图所示
表1 私人汽车拥有量相关因素的原始数据
Y
X1
X2
X3
X4
1988
28.49000
25094.00
739.1000
43.72000
94.24000
1989
34.71000
26366.00
899.6000
36.98000
96.28000
1990
42.29000
27674.00
1002.200
47.18000
98.22000
1991
60.42000
28661.00
1181.400
64.47000
99.96000
1992
73.12000
29540.00
1375.700
58.35000
101.4300
1993
81.62000
30195.00
1510.200
51.40000
102.8300
1994
96.04000
31203.00
1700.600
71.42000
104.1100
1995
118.2000
32175.00
2026.600
106.6700
105.6700
1996
155.7700
33173.00
2577.400
129.8500
108.3500
1997
205.4200
34169.00
3496.200
136.6900
111.7800
1998
249.9600
35174.00
4283.000
145.2700
115.7000
1999
289.6700
37304.00
4838.900
147.5200
118.5800
2000
358.3600
39449.00
5160.300
158.2500
122.6400
2001
423.7000
41608.00
5425.100
163.0000
127.9000
2002
533.9000
43748.00
5854.000
183.2000
135.2000
2003
625.3000
45906.00
6280.000
207.0000
140.3000
2004
770.8000
48064.00
6859.600
234.2000
169.8000
2005
969.0000
50212.00
7702.800
325.1000
176.5000
2006
1219.200
52376.00
8472.200
444.4000
181.0000
2007
1481.700
54283.00
9421.600
509.1000
187.1000
2008
1848.100
56212.00
10493.00
570.5000
334.5000
2009
2333.300
57706.00
11759.50
727.9000
345.7000
2010
2876.200
59379.00
13785.80
888.9000
358.4000
资料来源:私人私家车的拥有量的计量分析
五.模型的估计和调整
1.各变量对私家车拥有量的回归
运用Eviews软件,采用最小二乘法,对表1中的数据进行线性回归,对所建模型进行估计,估计结果见下图。(图1)
Dependent Variable: Y
Method: Least Squares
Date: 12/18/13 Time: 22:47
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-396.8791
191.8043
-2.069187
0.0532
X1
0.002875
0.007421
0.387372
0.7030
X2
0.003186
0.030019
0.106121
0.9167
X3
2.540321
0.290348
8.749228
0.0000
X4
2.019155
0.563273
3.584682
0.0021
R-squared
0.995198
Mean dependent var
646.7509
Adjusted R-squared
0.994130
S.D. dependent var
796.7598
S.E. of regression
61.04194
Akaike info criterion
11.25066
Sum squared resid
67070.12
Schwarz criterion
11.49751
Log likelihood
-124.3826
Hannan-Quinn criter.
11.31274
F-statistic
932.5459
Durbin-Watson stat
0.764574
Prob(F-statistic)
0.000000
图1
从估计结果可得模型为:
Y=-396.8791+0.002875
+0.003186
+2.540321
+2.019155
T (-2.069187)(0.387972) (0.106121) (8.749228) (3.584682)
=0.995198
^2=0.994130 F=932.5459 D.W=0.764574
(1)经济意义检验:
由回归得出的函数结果可以看出
的系数为0.002875,
的系数为0.0032,X3的结果为2.5403,X4的结果为2.0912,这四个解释变量的符号与预期相一致,并且其大小在经济理论上也解释得通。
(2)拟合优度检验:
从最小二乘估计得出得结果可以看出可决系数R^2=0.9952,Adjusted R-squared为0.9941,因此可以得出结论即该模型的5解释变量解释了从1988年到2010年间全国私人汽车拥有量变异的99%,样本拟合效果比较好。在5%显著性水平下,查F分布表得自由度为4和18的临界值为F(4,18)=2.93,而模型的F值为932.5459明显大于临界值2.93,表明整个模型的估计效果显著,X1、X2、X3、X4四个变量联合起来对全国汽车拥有量有显著的影响。
(3)计量经济学检验:
在5%显著性水平下,查t分布表得自由度为18的临界值为2.101,β1,β2,β3,β4的估计值的t统计量分别为0.3874,0.1061,8.7492,3.5867,β1和β2的t统计量小于t(18)的临界值2.101, β3和β4的估计值对应的t统计量则大于临界值,这说明全国的私人汽车拥有量与全国汽车产量和全国公路里程存在明显的线性相关关系,但是对于全国城镇人口数和城镇居民人均可支配收而言却不存在显著的线性相关关系,但这与实际不相符,说明模型可能存在多重共线性。
(4)多重共线性检验:
根据以上分析,认为模型可能存在严重的多重共线性问题,为了验证是否真实存在,计算解释变量之间的相关系数,得到相关系数矩阵:
从上面的相关系数矩阵可以看出,各解释变量之间的相关系数很高,证实确实存在多重共线性。
为了修正多重共线性,采用逐步回归法检验和解决多重共线性。
a. 分别做Y对X1、X2、X3、X4的一元回归,结果为:
Dependent Variable: Y
Method: Least Squares
Date: 12/20/13 Time: 09:41
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1986.162
269.1593
-7.379134
0.0000
X1
0.065846
0.006499
10.13141
0.0000
R-squared
0.830160
Mean dependent var
646.7509
Adjusted R-squared
0.822072
S.D. dependent var
796.7598
S.E. of regression
336.0854
Akaike info criterion
14.55555
Sum squared resid
2372021.
Schwarz criterion
14.65429
Log likelihood
-165.3888
Hannan-Quinn criter.
14.58038
F-statistic
102.6455
Durbin-Watson stat
0.200738
Prob(F-statistic)
0.000000
Dependent Variable: Y
Method: Least Squares
Date: 12/20/13 Time: 09:42
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-371.1881
85.69307
-4.331600
0.0003
X2
0.200373
0.013618
14.71350
0.0000
R-squared
0.911574
Mean dependent var
646.7509
Adjusted R-squared
0.907363
S.D. dependent var
796.7598
S.E. of regression
242.5039
Akaike info criterion
13.90285
Sum squared resid
1234971.
Schwarz criterion
14.00159
Log likelihood
-157.8828
Hannan-Quinn criter.
13.92769
F-statistic
216.4871
Durbin-Watson stat
0.128094
Prob(F-statistic)
0.000000
=0.911574
Dependent Variable: Y
Method: Least Squares
Date: 12/20/13 Time: 09:46
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-155.2344
22.50750
-6.897008
0.0000
X3
3.383861
0.068251
49.57960
0.0000
R-squared
0.991529
Mean dependent var
646.7509
Adjusted R-squared
0.991126
S.D. dependent var
796.7598
S.E. of regression
75.05654
Akaike info criterion
11.55730
Sum squared resid
118303.2
Schwarz criterion
11.65604
Log likelihood
-130.9090
Hannan-Quinn criter.
11.58213
F-statistic
2458.136
Durbin-Watson stat
0.797130
Prob(F-statistic)
0.000000
=0.991529
Dependent Variable: Y
Method: Least Squares
Date: 12/20/13 Time: 09:47
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-814.5728
89.13548
-9.138592
0.0000
X4
9.504705
0.514884
18.45989
0.0000
R-squared
0.941952
Mean dependent var
646.7509
Adjusted R-squared
0.939187
S.D. dependent var
796.7598
S.E. of regression
196.4825
Akaike info criterion
13.48197
Sum squared resid
810713.1
Schwarz criterion
13.58070
Log likelihood
-153.0426
Hannan-Quinn criter.
13.50680
F-statistic
340.7675
Durbin-Watson stat
1.873528
Prob(F-statistic)
0.000000
=0.941952
b.由上四个图我们可以看出,X3对应的可决系数
最大,所以以X3为基础,顺次加入其他变量逐步回归,结果为:
Dependent Variable: Y
Method: Least Squares
Date: 12/20/13 Time: 09:49
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-232.8429
107.4047
-2.167902
0.0424
X3
3.272795
0.165308
19.79818
0.0000
X1
0.002599
0.003515
0.739362
0.4683
R-squared
0.991755
Mean dependent var
646.7509
Adjusted R-squared
0.990930
S.D. dependent var
796.7598
S.E. of regression
75.88004
Akaike info criterion
11.61729
Sum squared resid
115155.6
Schwarz criterion
11.76540
Log likelihood
-130.5989
Hannan-Quinn criter.
11.65454
F-statistic
1202.809
Durbin-Watson stat
0.768221
Prob(F-statistic)
0.000000
=0.991755
Dependent Variable: Y
Method: Least Squares
Date: 12/20/13 Time: 09:50
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-170.4974
30.41258
-5.606148
0.0000
X3
3.217568
0.230566
13.95508
0.0000
X2
0.010762
0.014239
0.755834
0.4586
R-squared
0.991765
Mean dependent var
646.7509
Adjusted R-squared
0.990941
S.D. dependent var
796.7598
S.E. of regression
75.83461
Akaike info criterion
11.61609
Sum squared resid
115017.8
Schwarz criterion
11.76420
Log likelihood
-130.5851
Hannan-Quinn criter.
11.65334
F-statistic
1204.262
Durbin-Watson stat
0.744977
Prob(F-statistic)
0.000000
=0.991765
Dependent Variable: Y
Method: Least Squares
Date: 12/20/13 Time: 09:51
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-301.4367
45.35317
-6.646431
0.0000
X3
2.734985
0.192522
14.20611
0.0000
X4
1.951174
0.554810
3.516833
0.0022
R-squared
0.994766
Mean dependent var
646.7509
Adjusted R-squared
0.994243
S.D. dependent var
796.7598
S.E. of regression
60.45601
Akaike info criterion
11.16282
Sum squared resid
73098.57
Schwarz criterion
11.31092
Log likelihood
-125.3724
Hannan-Quinn criter.
11.20007
F-statistic
1900.595
Durbin-Watson stat
0.688210
Prob(F-statistic)
0.000000
=0.994243
c.经过比较,加入X4的方程
的值为0.994766,是最大的,而且它的t检验显著,所以保留X4,再加入其他新变量逐步回归,结果为
Dependent Variable: Y
Method: Least Squares
Date: 12/20/13 Time: 09:53
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-414.2426
97.44795
-4.250912
0.0004
X3
2.557747
0.233141
10.97080
0.0000
X4
2.021295
0.548070
3.688026
0.0016
X1
0.003602
0.002767
1.301855
0.2085
R-squared
0.995195
Mean dependent var
646.7509
Adjusted R-squared
0.994436
S.D. dependent var
796.7598
S.E. of regression
59.43244
Akaike info criterion
11.16433
Sum squared resid
67112.09
Schwarz criterion
11.36181
Log likelihood
-124.3898
Hannan-Quinn criter.
11.21399
F-statistic
1311.647
Durbin-Watson stat
0.775412
Prob(F-statistic)
0.000000
得
=0.995195
Dependent Variable: Y
Method: Least Squares
Date: 12/20/13 Time: 09:55
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-325.1268
48.66633
-6.680735
0.0000
X3
2.502305
0.267077
9.369211
0.0000
X4
2.003732
0.549153
3.648766
0.0017
X2
0.013928
0.011236
1.239585
0.2302
R-squared
0.995158
Mean dependent var
646.7509
Adjusted R-squared
0.994393
S.D. dependent var
796.7598
S.E. of regression
59.66100
Akaike info criterion
11.17200
Sum squared resid
67629.25
Schwarz criterion
11.36948
Log likelihood
-124.4781
Hannan-Quinn criter.
11.22167
F-statistic
1301.569
Durbin-Watson stat
0.719800
Prob(F-statistic)
0.000000
d. 在X3,X4的基础上加入X1后的方程
的值为0.985915,比之前下降了,而且X1的参数t为-1.301855,不合理。在X3,X4的基础上加入X2后的方程
的值为0.994558,较之前有所改善,但它的t检验不显著,这说明是X1,X2引起严重的多重共线性,应予以剔除。最后修正严重多重共线性的回归结果为:
Dependent Variable: Y
Method: Least Squares
Date: 12/20/13 Time: 09:58
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-301.4367
45.35317
-6.646431
0.0000
X3
2.734985
0.192522
14.20611
0.0000
X4
1.951174
0.554810
3.516833
0.0022
R-squared
0.994766
Mean dependent var
646.7509
Adjusted R-squared
0.994243
S.D. dependent var
796.7598
S.E. of regression
60.45601
Akaike info criterion
11.16282
Sum squared resid
73098.57
Schwarz criterion
11.31092
Log likelihood
-125.3724
Hannan-Quinn criter.
11.20007
F-statistic
1900.595
Durbin-Watson stat
0.688210
Prob(F-statistic)
0.000000
图A
经过修正多重共线性后得出的函数为:
Y=-301.4367+2.734985X3+1.951174X4
T=(-6.646431) (14.20611) (3.516833)
=0.994677 adjust
=0.994243 F=1900.595 D.W=0.688210
(5)异方差检验;
对修正多重共线性后的新函数进行异方差性检验,运用white检验,得到的结果为;
Heteroskedasticity Test: White
F-statistic
0.588700
Prob. F(5,17)
0.7087
Obs*R-squared
3.394616
Prob. Chi-Square(5)
0.6394
Scaled explained SS
1.398088
Prob. Chi-Square(5)
0.9245
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/20/13 Time: 12:52
Sample: 1988 2010
Included observations: 23
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-152.1737
15780.80
-0.009643
0.9924
X3
-19.32487
49.09305
-0.393638
0.6987
X3^2
-0.163112
0.133150
-1.225025
0.2373
X3*X4
0.713542
0.638764
1.117068
0.2795
X4
87.50412
233.1013
0.375391
0.7120
X4^2
-0.876957
0.911165
-0.962457
0.3493
R-squared
0.147592
Mean dependent var
3178.199
Adjusted R-squared
-0.103116
S.D. dependent var
3391.708
S.E. of regression
3562.288
Akaike info criterion
19.41365
Sum squared resid
2.16E+08
Schwarz criterion
19.70987
Log likelihood
-217.2570
Hannan-Quinn criter.
19.48815
F-statistic
0.588700
Durbin-Watson stat
1.411426
Prob(F-statistic)
0.708694
n
的结果为3.394616,由white检验可知,在0.05的显著性水平下,自由度为5的卡方临界值为11.0705,远远大于n
的值,所以接受原假设,即认为该模型不存在异方差性。
(6)相关性检验
由上图A由上可知D.W的值为0.688210,且样本容量为n=23,给定显著性水平为1%,才查D.W表得dl =1.02, du=1.19,这是有D.W
du,说明在1%显著水平下广义差分模型中已无自相关,不必再进行迭代。同时可见,可决系数
、t、F统计量也均达到理想水平。
由差分方程式得
1=
=—274.91158
由此,我们得到最终的我国私家车拥有量计量模型为
Y=-274.91158+2.887055X3+1.535899X4
六.结论
通过该回归模型可以有以下结论:
(1)我国人均私家车的拥有量主要受全国汽车产量和人均公路里程数的影响,而且均存在正向相关关系;
(2)在1988~2010年间,在其他解释变量保持不变的条件下,随着全国汽车产量的增加引起的全国的私家车拥有量的增长幅度大于全国的全国汽车产量的增长幅度,故而全国汽车产量是影响私家车拥有量的最重要的因素。
(3)公路里程对私家车拥有量有很大影响,说明公路里程数的增加有助于增加国内私家车的拥有量。私家车拥有量与人均公路里程存在互为因果的关系,这说明随着我国公路建设加强,使居民对私家车的需求上升,同时由于私家车增多对交通产生的压力也促使我国公路的建设和改造。