本地帮助 Help 命令名
在线帮助 Findit 命令名
第一讲:
use 打开数据文件,一般加 clear 选型清空内存中现有数据。
sysuse 打开系统数据文件。
describe 描述数据
edit 利用数据编辑器进行数据编辑
list 类似于 edit,但只能显示不能修改数据。
display 显示计算结果。经常写为: di
summarize 求某个变量的观察值个数、平均值、标准差、最小值和最大值。经常写
为:sum
scatter 生成两个变量的散点图。
set obs 定义样本个数(使用前一定要用 drop 或者 clear 命令清空当前样本)
generate 建立新变量并赋值。经常写为 gen
(**********************)stata 命令格式(**********************)
[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]
1。Command 命令动词,经常用缩写。
2。varlist 表示一个变量或者多个变量,多个变量之间用空格隔开。如 sum price
weight
3。 by varlist 分类信息 按照某一变量的不同特性分类
4。 =exp 赋值及运算
5。 if exp 挑选满足条件的数据
6。 in range 对数据进行范围筛选
7。 Weight 给数据赋一个权重
8。 , options 命令增加一些可选信息
Label define marry 1 ”married” 0 ”unmarried”
第二讲:
(**********************)建立回归方程(**********************)
Regress 命令详解:
Regress depvar [indepvars] [if] [in] [weight] [, options]
打开系统文件 auto,建立如下方程:
sysuse auto,clear
regress price mpg weight foreign
1。要求方程省略常数项(自己设置常数项)
Reg price mpg weight foreign , nocons (hascons)
2。稳健性估计(一般用于大样本 OLS)
Reg price mpg weight foreign , vce (robust)
或者:reg price mpg weight foreign, r (常用的)
3。设置置信区间(默认 95%)
reg price mpg weight foreign, level(99)(数字可以变)
4。标准化系数
reg price mpg weight foreign, beta
5。部分数据回归
reg price mpg weight length foreign in 1/30
reg price mpg weight length if foreign==0
(**********************)回归后预测值的获得(**********************)
Predict
1。拟合值的获得:
predict yhat, xb 或者 predict yhat 获取拟合值并将拟合值 y 定义为 yhat
2。残差的获得
predict e , residuals 或者 predict e, res 获得残差并把残差定义为 e
(**********************)回归的假设检验(**********************)
(**********************)test 命令(**********************)
例二: use wage2, clear
reg lnwage educ tenure exper expersq
1。教育(educ)和工作时间(tenure)对工资的影响相同。
test educ=tenure (两个变量的系数是否相等)
2。工龄(exper)对工资没有影响
test exper (检验 exper 的系数是否为 0) 或者 test exper =0
3。检验 educ 和 tenure 的联合显著性
test educ tenure(检验两个变量的系数是否同时为 0)或者 test (educ=0) (tenure=0)
(**********************)非线性检验:testnl(**********************)
例一 .
sysuse auto
gen weight2 = weight^2
reg price mpg trunk length weight weight2 foreign
testnl _b[mpg] = 1/_b[weight](非线性关系下,在需要写成_b[变量名]的形式)
testnl (_b[mpg] = 1/_b[weight]) (_b[trunk] = 1/_b[length])
(**********************)约束回归(**********************)
定义约束条件
constraint define n 条件
约束回归语句
cnsreg 被解释变量 解释变量, constraints(条件编号)
例二:use nerlove,clear
cons def 1 lnpl+lnpk+lnpf=1
. cons def 2 lnq=1
. cnsreg lntc lnq lnpl lnpk lnpf, c(1-2)
第三讲:
(**********************)异方差(**********************)
(**********************)异方差的检验(**********************)
1。残差图:
rvfplot (residual-versus-fitted plot)(残差与拟合值的散点图)
rvpplot 变量名(residual-versus-predictor plot)(残差与解释变量的散点图)
作图命令一定要在回归完成之后进行
Reg y x1 x2 x3
Rvpplot
Rvpplot x1(残差与 x1 的散点图)
2。怀特检验命令:
做完回归后,使用命令:
estat imtest, white(imtest 指的是:information matrix test 信息矩阵检验)
3。BP 检验:做完回归后,使用命令:
estat hettest ,normal(使用拟合值 yˆ )
estat hettest,rhs (使用方程右边的解释变量,而不是 yˆ )
estat hettest [varlist] (指定使用某些解释变量)
最初的 BP 检验假设扰动项服从正态分布,有一定局限性。Koenker(1981)将
此假定放松为 iid,在实际中较多采用,其命令为:
estat hettest, iid
estat hettest, rhs iid
estat hettest [varlist],iid
(**********************)异方差的处理(**********************)
异方差的处理如果考得话我感觉考到使用“异方差稳健标准差”的可能性比较高。
但是只有记住参数,,r 就一切 OK 了。
1。使用“异方差稳健标准差”(robust standard error):这是最简单,也是目前比较
流行的
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
。只要样本容量较大,即使在异方差的情况下,只要使用稳健标准差,
则所有参数估计、假设检验均可照常进行。
sysuse nlsw88, clear
reg wage ttl_exp race age industry hours
reg wage ttl_exp race age industry hours, r 使用稳健标准差
2。广义最小二乘法(GLS)、加权最小二乘法(WLS)以及可行广义最小二乘法(FGLS)。
其含义为
Var(b) = (X'X)-1*(X'ΩX)* (X'X)-1
通过加权使得 Ω=I
因此,GLS 和 WLS 要求 Ω 已知。
例如:假设我们知道异方差是由变量 weight 引起。
sysuse auto, clear
gen wei2 = weight^2
reg price mpg weight turn foreign [aw=1/wei2]设置权重 aw 为 weight 的平方的倒数
rvpplot weight
(去年王永画的范围内明确指明 FGLS 不考!!!)
FGLS 的步骤
(1) 对原方程用 OLS 进行估计,得到残差项的估计 ûi ,
(2) 计算 ln(ûi2)
(3) 用 ln(û2)对所有独立的解释变量进行回归,然后得到拟合值 ĝi
(4) 计算 ĥi = exp(ĝi)
(5) 用 1/ ĥi 作为权重,做 WLS 回归。
Reg y x1 x2 x3„„
predict u,res
gen lnu2=ln(u^2)
reg lnu2 x1 x2…
predict g,xb
gen h=exp(g)
gen invvar=1/h
reg y x1 x2…*aweight=invvar+
(**********************)自相关 (**********************)
考察英国政府如何根据长期利率(r20)的变化来调整短期利率(rs),数据集为
ukrates.dta
(1)做如下回归:, 其中:
回归方程为:
use ukrates,clear
tsset month
reg D.rs LD.r20
“L.”滞后算子 “L2.”滞后两阶
“D.”一阶差分算子 “D2.”D2.X=Xt-Xt-2
“LD.”表示一阶差分的滞后值或者滞后值的一阶差分
1。图形法:自相关系数和偏自相关系数
predict e1,res
ac e1(e1 的自相关系数)
pac e1(e1 的偏自相关系数)
corrgram e1,lag(10)
2。t 检验和 F 检验(wooldridge)
思想:t 检验,如果存在一阶自相关,残差项与其一阶滞后项回归后系数显著,如果
解释变量非严格外生,回归时可加入解释变量。
reg e1 L.e1
reg e1 L.e1 LD.r20
同理,可以用 F 检验检验是否存在高阶自相关
reg e1 L(1/2).e1
3。DW 检验:只能检验一阶自相关的序列相关形式,并且要求解释变量严格外生。
reg D.rs LD.r20
dwstat
4。Q 检验和 Bartlett 检验
reg D.rs LD.r20
predict e2,res(得到回归残差命名为 e2)
wntestq e2(使用 stata 提供的默认的滞后期)
wntestq e2,lag(2)(使用指定数字的滞后期此处为滞后 2 期)
wntestb e2(对 e2 进行 bartlett 检验注意这里是 wntestb 上面的是 wntestq)
5。D-W’s h 检验
estat durbinalt
estat durbinalt,lag(2)指定两期
6。B-G 检验
bgodfrey
bgodfrey,lag(2)
ttt rrs 120 1 ttt rsrsrs 211 202020 ttt rrr
(**********************)自相关的处理(**********************)
1。Newey 稳健性估计或者聚类稳健性估计。
reg D.rs LD.r20
newey D.rs LD.r20 ,lag(1)(HAC 标准差,必须指定滞后阶数 p)
newey D.rs LD.r20 ,lag(2)
2. 某些模型中可以通过取对数或者取差分消除自相关。
(伟大的 FGLS 在时间紧迫的情况下依然可能或许保不齐说不定有可能又不需要看了)
3. FGLS 估计(一阶自相关)
假设干扰项服从 AR(1)过程:一阶准差分。
Cochrane-Orcutt(1949) 估计(舍弃第一期观察值)
prais D.rs LD.r20,corc
prais D.rs LD.r20,rho(dw) corc
Prais-Winsten(1954) 估计(对第一期观察值进行处理 sqrt(1-rho^2)*y1)
prais D.rs LD.r20
prais D.rs LD.r20,rho(dw)
时间序列一般样本不会太大,因此不要轻易舍弃。
(**********************)模型的设定和筛选问题(**********************)
1。Link 检验。基本思想:如果模型的设定是正确的,那么 y 的拟合值的平方项将不
应具有解释能力。
use wage1,clear
gen lnwage=ln(wage)
reg lnwage educ exper tenure
linktest (或许是遗漏了重要的解释变量)
gen educ2=educ^2
gen exper2=exper^2
reg lnwage educ exper tenure educ2 exper2
linktest
2。Ramsey 检验。基本思想:如果模型设定无误,那么拟合值和解释变量的高阶项
都不应再有解释能力。
use wage1,clear
reg lnwage educ exper tenure
estat ovtest
estat ovtest,rhs (或许是遗漏了重要的解释变量)
gen educ2=educ^2
gen exper2=exper^2
reg lnwage educ exper tenure educ2 exper2
estat ovtest
(传说又一次的出现了,伟大的上一级的师兄师姐的范围内再次明确指定嵌套模型和非嵌套
模型貌似也可以去见耶稣了。)
(**********************)嵌套模型和非嵌套模型(**********************)
1。嵌套模型(大模型好还是小模型好)
方法 1:
reg lnwage educ exper tenure
reg lnwage educ exper tenure educ2 exper2
test educ2 exper2
方法 2:利用赤池信息准则和贝叶斯信息准则
选择最小的 AIC 和 BIC
reg lnwage educ exper tenure
estat ic
reg lnwage educ exper tenure educ2 exper2
estat ic
2。非嵌套的 J 检验和 Cox 检验(两个方程包含的解释变量不相同或不完全相同 )
reg lnwage educ exper tenure
reg lnwage educ exper exper2
nnest lnwage educ exper tenure(educ exper exper2)
多重共线性:
多重共线性的检验:膨胀因子 estat vif
经验上当 (1) VIF 的均值 >=2
(2) VIF 的最大值 接近或者超过 10
认为有较为严重的多重共线性。
reg price mpg weight length foreign
estat vif
还可以利用解释变量的相关系数
pwcorr mpg weight length foreign
(****************)逐步回归法分为逐步剔除和逐步加入(****************)
逐步剔除又分为逐步剔除(Backward selection)和逐步分层剔除(Backward hierarchical
selection)
1。逐步剔除
注意:逐步提出是 pr 而逐步加入时 pe
stepwise, pr(显著性水平): 回归方程
例如:对 auto 数据
Stepwise,pr(0.05):reg price mpg rep78 headroom trunk weight length turn displacement
gear_ratio foreign
2。逐个分层剔除
再次注意:分层加入的时候需要加上一个 hier 如下,你懂的
Stepwise,pr(0.05) hier:reg price mpg rep78 headroom trunk weight length turn
displacement gear_ratio foreign
去掉 foreign 重新做一遍
逐步加入又分为逐步加入(Forward selection)和逐步分层加入(Forward hierarchical
selection)
1。逐步加入
stepwise, pe(显著性水平): 回归方程
例如:对 auto 数据
Stepwise,pe(0.05):reg price mpg rep78 headroom trunk weight length turn displacement
gear_ratio foreign
2。逐个分层加入
Stepwise,pe(0.05) hier:reg price mpg rep78 headroom trunk weight length turn
displacement gear_ratio foreign
(哎呀呀呀越来越感觉上级的师兄师姐们是多么的幸福啊!他们竟然也灰常灰常明
确的指出残差
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
和异常样本点的处理不考,唉时运不济,命途多舛啊!)
(**********************)残差分析和异常样本点的处理(**********************)
1。残差序列是否服从正态分布
sysuse auto, clear
reg price weight mpg turn foreign
predict e, res
kdensity e, normal
pnorm e (对中间部位敏感)
qnorm e (对尾部敏感 )
sktest e
swilk e
2 对特殊样本点的检验和处理:离群样本点、杠杆样本点和关键样本点。
离群样本点:残差值较大的样本点
杠杆样本点:与样本整体(X‘X)很不相同的少数样本点
关键样本点: 对回归结果有重要影响的少数样本点
图形分析
sysuse auto, clear
reg price weight mpg turn foreign
lvr2plot(注意两条红线的含义)
lvr2plot, mlabel(make)
离群值的获得
predict e1, res
list make e1
杠杆值的获得
predict lev1, leverage
list make lev1
关键样本点通常既是离群样本点又是杠杆样本点,用 DFITS 统计量和 DFBETA 统计量
加以观察。
DFITS 统计量:经验临界值 2*sqrt(k/N)
reg price weight mpg turn foreign
predict d1,dfits
dis 2*sqrt(5/74)
list make price weight d1 if abs(d1)>0.51987524
sum price weight
通过排序方式找到离群样本点和杠杆值样本
predict lev2, leverage
predict e, res
gen e2 = e^2
gsort -lev2
list make price lev2 e2 in 1/10
gsort -e2
list make price lev2 e2 in 1/10
第四讲
(**********************)虚拟变量(**********************)
例子:引入虚拟变量之前
reg price weight
reg price weight if foreign==0
reg price weight if foreign==1
1。仅截距发生变化。我们以国产还是进口作为虚拟变量,为了熟悉虚拟变量的产生
过程,这里不用 foreign,而是产生一个新的虚拟变量 d1(虚拟变量的生成要灵活运
用 gen 语句和 replace 语句)。
gen d1 = 0
replace d1 = 1 if foreign==1 注意哦!神奇的事情就在这里发生了!当 foreign==1 的时候要
把 d1 赋值为 1 哦!!
reg price d1 weight
和前面做的回归比较,d1 反映了进口车和国产车常数项即截距的差异,斜率基本没有变
化。
2。仅斜率发生变化。产生一个新的虚拟变量 d2。为了使斜率变化,产生一个交乘
项 d2_weight。
gen d2 = 0
replace d2 = 1 if foreign==1
gen d2_weight=d2*weight
reg price weight d2_weight
和前面做的回归比较,斜率有变化,截距的变化不显著。
3。截距斜率同时变化。产生一个新的虚拟变量 d3。为了使斜率同时变化,产生一
个交乘项 d3_weight。
gen d3 = 0
replace d3 = 1 if foreign==1
gen d3_weight =d3*weight
reg price d3 weight d3_weight
和前面做的回归比较,截距、斜率均有变化,但截距的变化不显著。
(**********************)Chow 检验(**********************)
考察 1978-2006 年中国居民人均消费与人均国内总产值数据(当年价格)。估计中国
消费函数,并检验中国的消费函数是否在 1992 年邓小平“南巡”以后(含 1992 年)
发生了结构变化。
方法一,利用虚拟变量
use consumption_china,clear
gen d=(year>1991) (生成虚拟变量)
gen yd=y*d (生成虚拟变量与 GDP 的互动项)
reg c y d yd
test d yd
方法 2:下载最新程序 chow
findit chow
chow c y,chow(year>1991)
(**********************)格兰杰因果检验(**********************)
分别检验“消费是 GDP 的格兰杰因”与“GDP 是消费的格兰杰因”,将滞后期均设
为 2 年。方法 1:
reg y L(1/2).c L(1/2).y
test L.c L2.c
reg c L(1/2).y L(1/2).c
test L.y L2.y
方法 2:下载程序 gcause
findit gcause
gcause c y,lag(3)
gcause y c,lag(3)
(**********************)工具变量(**********************)
(**********************)二阶段最小二乘法:2SLS(**********************)
主要思想:进行两阶段回归。
假设方程为: y=b1x1+b2x2+u
其中 x1 是外生变量,x2 是内生变量,找到两个变量 z1 和 z2,作为 x2 的工具变量。
第一阶段回归:reg x2 x1 z1 z2 x2 结合了 z1 和 z2 的信息,此时取出 x2 的拟合值
x2_hat。
例子:
Reg x2 x1 z1 z2
Predict x2_hat(将 x2 的拟合值定义为 x2_hat)
第二阶段回归: reg y x1 x2_hat
(**********************)广义矩估计法:GMM(**********************)
基本思想:
求解如下一般化目标函数,使之最小化
J(b_GMM) = n*g(b_GMM)'*W*g(b_GMM)
其中,W 为权重矩阵
在球型扰动项的假定下,2SLS 是最有效的。但如果扰动项存在异方差或自相关,则
广义矩估计方法效果更好。
GMM 方法又分为两步 GMM 法和迭代 GMM 方法。
使用 grilic.dta 估计教育投资的回报率。
变量说明:lw80(80 年工资对数),s80(80 年时受教育年限),expr80(80 年时工
龄),tenure80(80 年时在现单位工作年限), iq(智商),med(母亲的教育年限),
kww(在‘knowledge of the World of Work’测试中的成绩),mrt(婚姻虚拟变量,已
婚=1),age(年龄)。
建立方程:
use grilic.dta,clear
reg lw80 s80 expr80 tenure80
对方程进行分析:
1。遗漏变量问题:认为方程遗漏了“能力”这个变量,加入 iq(智商)作为“能力”
的代理变量。
2。测量误差问题:iq(智商)对“能力”的测量存在误差。
3。变量内生性问题:s80 可能与扰动项中除“能力”以外的其他因素相关,因此是
内生变量。
解决方法:使用 med,kww,mrt,age 作为内生解释变量 iq 与 s80 的工具变量。
1。使用 2SLS。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first (看到了没?看到了没?
括号里的内容是用工具变量 med kww mrt age 替代内生变量 s80 iq)
2。使用两步 GMM 。
ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age)
3。使用迭代 GMM 。
ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age),igmm (,igmm 是使用迭
代 GMM 的标志哦!)
(**********************)弱工具变量检验(**********************)
工具变量 Z 与 X 的相关性较低时,2SLS 估计量存在偏误,Z 称为“弱工具变量”。
检验方法:
estat firststage
1。初步判断可以用偏 R2(partial R2)
(剔除掉模型中原有外生变量的影响)。
2。 Minimum eigenvalue statistic(最小特征值统计量),经验上此数应该大于 10。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first(, first 显示第一阶段的回
归)
estat firststage
(**********************)过度识别检验(**********************)
检验工具变量是否与干扰项相关,即工具变量是否为外生变量。目前仅限于在过度
识别的情况下,进行过度识别检验。
2SLS 根据 Sargan 统计量进行过度识别检验 ,GMM 使用 Hansen J Test 进行过度识别
检验。
命令均为: estat overid 检验工具变量的外生性
H0:所有工具变量都是外生的。
H1:至少有一个工具变量不是外生的,与扰动项相关。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first
estat overid
ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age)
estat overid
1。如果所有解释变量都是外生变量,则 OLS 比 IV 更有效。在这种情况下使用 IV,
虽然估计量仍然是一致的,会增大估计量的方差。2。如果存在内生解释变量,则
OLS 是不一致的,而 IV 是一致的。
豪斯曼检验(Hausman specification test)原假设:
H0 :所有解释变量均为外生变量。
H1:至少有一个解释变量为内生变量。
quietly reg lw80 s80 expr80 tenure80 iq
est store ols
quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age)
est store iv
hausman iv ols
(哎呀呀呀幸福时刻啊!!!咱们竟然也有不需要看的地方了!!!幸福中^_ !^)
(**********************)极大似然估计(**********************)
MLE 的基本步骤
1. 推导最大似然函数
2. 编写似然函数的 stata 程序(可选:似然函数的一阶和二阶导数 d1,d2)
3. 设定解释变量和被解释变量:
ml model 命令
4. 估计最大似然函数:ml maximize 命令
假设 x_i 服从均值为 mu, 标准差为 sigma^2 的正态分布。
cap program drop myprog
program define myprog
version 10.0
args lnf mu sigma
quietly replace `lnf' = ln(normalden($ML_y1, `mu', `sigma'))
end
第五讲:
(**********************)面板数据基本命令(**********************)
1。指定个体截面变量和时间变量:xtset
2。对数据截面个数、时间跨度的整体描述:xtdes。(显示面板数据的结构是否为平
衡面板)
3。对每个个体分别显示该变量的时间序列图: xtline。
4。静态面板数据基本回归命令:xtreg。
调出一笔数据:
use grunfeld,clear
xtset company year(设置界面数据为 company,时间维度数据为 year)
xtdes
xtline invest
(**********************)混合回归(**********************)
直接使用命令:
reg invest mvalue kstock
一般是有偏的
(**********************)固定效应模型: (**********************)
方法 1:不需要得到具体的截距项。
xtreg invest mvalue kstock ,fe
方法 2:需要得到每个个体的截距项。
tab company , gen(dum) (这是批量产生虚拟变量的命令)
reg invest mvalue kstock dum*,nocons
实质:方法 1 实际上是用每个个体的观察值减去组内平均,去除掉个体效应,然后
用 OLS 估计。
(**********************)Hausman 检验(**********************)
基本思想:由于在固定效应模型中,实际上是把 ui作为解释变量处理,因此并不要
求 Cov(ui,Xit)=0。而在随机效应模型中,必须保证 Cov(ui,Xit)=0。
所以:
1。如果 Corr(a_i,x_it) = 0, Fe 和 Re 都是一致的,但,Re 更有效。
2。如果 Corr(a_i,x_it)!= 0, Fe 仍然一致,但 Re 是有偏的。
因此原假设是 Corr(a_i,x_it) = 0,即应该采用随机效应。
xtreg invest mvalue kstock ,fe
est store fixed (ext 貌似应该是 estate 吧)
xtreg invest mvalue kstock ,re
est store random
hausman fixed random
本题接受原假设,即应该用随机效应。
Hausman 检验为负
解决办法:
hausman fixed random,sigmaless
hausman fixed random,sigmamore
这种情况一般要拒绝原假设,采用固定效应模型。
(happy time 到了 非平衡面板如何处理这里是真真的不考啊„„)
2。非平衡面板如何处理?
use nlswork,clear
xtset idcode year
xtdes
这是一份典型的大 n 小 t 型非平衡面板数据。
方法一:下载命令 xtbalance 提取成一个平衡面板数据,但不推荐使用,因为会损失大量
样本。
方法二:利用算法填补缺失值,需要经济理论和算法的支撑。
3。获取到的面板数据格式不符合要求的处理。
例如如下
表格
关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载
格式该如何处理?
处理方法:
扁平数据变长条数据的命令:reshape
use invest2,clear
edit
reshape long invest kstock, i(company) j(year)
(**********************)图形表示(**********************)
use grunfeld,clear
1。xtline invest
2。xtline invest,overlay
3。xtline invest mvalue kstock
(**********************)其他回归方法 (**********************)
1。聚类稳健的标准差
通常可以假设不同个体之间的扰动项相互独立,但同一个体在不同时期的扰动项之
间往往存在自相关。故须采用聚类稳健的标准差。
use grunfeld,clear
xtset company year
reg invest mvalue kstock,vce(cluster company)
同理有:
xtreg invest mvalue kstock,fe vce(cluster company)
xtreg invest mvalue kstock,re vce(cluster company)
(**********************)组间估计法(**********************)
对于随机效应模型,还可以采用“组间估计量”。对于那些每个个体的时间序列数据
较不准确或“噪音”较大的数据,可对每个个体取时间平均值,然后用平均值来回
归。
xtreg invest mvalue kstock ,be(唉就是个参数的事儿„„)
由于损失了较多信息量,组间估计法并不常用。
(额,极大似然估计就当没有从课本上出现过吧„„这个也不考)
(**********************)极大似然估计(**********************)
如果随机效应模型中假设扰动项服从正态分布,则可以使用最大似然估计法(MLE)
来进行估计。
xtreg invest mvalue kstock ,mle
与随机效应模型的估计比较结果几乎完全一致。
(谁让你是双向固定效应呢,唉算了吧 也不用考了)
(**********************)双向固定效应模型(**********************)
固定效应模型: Yit=ai+XitB+εit
双向固定效应模型:Yit=ai+ft+XitB+εit
实际上添加了 t-1 个时间虚拟变量。主要反应随着时间变化的一些特征。
tab year,gen(yr)
edit
drop yr1
xtreg invest mvalue kstock yr*,fe
大部分时间虚拟变量显著,说明随着时间的变动,invest 有不断变动的趋势。
检验:可以使用似然比检验。
原假设:时间虚拟变量不显著。
xtreg invest mvalue kstock ,fe
est store fe1
xtreg invest mvalue kstock yr*,fe
est store fe2
lrtest fe1 fe2
整体来看时间虚拟变量不够显著。
(**********************)异方差、序列相关和截面相关(**********************)
大 n 小 T 重点关注异方差
大 T 小 n 重点关注序列相关
由于面板数据同时兼顾了截面数据和时间序列的特征,所以异方差和序列相关必然
会存在于面板数据中;同时,由于面板数据中每个截面(之间还可能存在内在的联
系,所以,截面相关性也是一个需要考虑的问题。
1。异方差的检验(组间,一般不考虑组内):
这里的数字要记清楚啊!跟后面的容易混!
findit xttest3 或者直接
ssc install xttest3
xtreg invest mvalue kstock ,fe
xttest3
随机效应模型由于本身已经较大程度的考虑了异方差问题,主要体现在 sigma_u^2
上 ,因此不考虑异方差问题。
2。组内序列相关的检验:
固定效应: xtserial
基本思想:若无序列相关,则一阶差分后残差相关系数应为-0.5。
findit xtserial
xtserial invest mvalue kstock
xtserial invest mvalue kstock,output
随机效应:
findit xttest1
xtreg market stock invest, re
xttest1
3。截面相关的检验:
ssc install xttest2
xtreg invest mvalue kstock ,fe
xttest2
1。异方差的处理
xtreg invest mvalue kstock , fe robust
2。一阶自相关的处理
xtregar invest mvalue kstock , fe
3。高阶自相关的处理
findit newey2
newey2 invest mvalue kstock , lag(2)
4。截面相关的处理
xtreg invest mvalue kstock ,fe cluster(company)
xtreg invest mvalue kstock ,re cluster(company)
(**********************)面板数据的 FGLS 估计(**********************)
命令一: xtgls 命令
1。假设方程不存在异方差、自相关和截面相关,模型可以采用混合OLS (Pooled OLS)。
xtgls invest mvalue kstock, panel(iid)
2。若模型存在异方差。
xtgls invest mvalue kstock, panel(het)
命令二:xtpcse 命令
1。 OLS 估计,面板稳健性标准差
xtpcse invest mvalue kstock
2。 Prais_Winsten 估计,个体具有共同的自相关系数
xtpcse invest mvalue kstock, corr(ar1)
3。每个截面有自己的自相关系数
xtpcse invest mvalue kstock, corr (psar1)
4。只考虑异方差,不考虑截面相关
xtpcse invest mvalue kstock, corr (ar1) hetonly
第六讲
(额产生模拟数据,很神奇的被上一级里滑进了封杀的范围内。)
(**********************)产生模拟数据(**********************)
1。产生一个 AR(1)的平稳时间序列:
sim_arma ar_1, ar(0.9) nobs(300)
2。产生一个 MA(1)的时间序列:
sim_arma ma_1, ma(0.8) nobs(300)
3。产生一个 ARMA(1,1)的模型:
sim_arma arma_11, ar(0.8) ma(0.5) nobs(300)
4。产生两个随机游走过程
sim_arma ar_2, ar(1) nobs(300)
sim_arma ar_3, ar(1) nobs(300)
将文件保存起来
1。画出时间序列的趋势线:
line ar_1 _t,yline(0)
line ma_1 _t,yline(0)
line arma_11 _t,yline(0)
line ar_2 ar_3 _t,yline(0)
2。画出时间序列的相关图和自相关图
ac
pac
ARIMA 模型的估计
打开数据文件 mpyr.dta
1。产生实际货币的对数值,并画出各变量趋势图。
line logmr logy r year
2。检验 logmr 的平稳性
dfuller logmr