首页 stata命令(2010年)

stata命令(2010年)

stata命令(2010年) 本地帮助 Help 命令名在线帮助 Findit 命令名第一讲：  use 打开数据文件，一般加 clear 选型清空内存中现有数据。  sysuse 打开系统数据文件。  describe 描述数据  edit 利用数据编辑器进行数据编辑  list 类似于 edit，但只能显示不能修改数据。  display 显示计算结果。经常写为： di  summarize 求某个变量的观察值个数、平均值、标准差、最小值和最大...

本地帮助 Help 命令名在线帮助 Findit 命令名第一讲：  use 打开数据文件，一般加 clear 选型清空内存中现有数据。  sysuse 打开系统数据文件。  describe 描述数据  edit 利用数据编辑器进行数据编辑  list 类似于 edit，但只能显示不能修改数据。  display 显示计算结果。经常写为： di  summarize 求某个变量的观察值个数、平均值、标准差、最小值和最大值。经常写为：sum  scatter 生成两个变量的散点图。  set obs 定义样本个数(使用前一定要用 drop 或者 clear 命令清空当前样本)  generate 建立新变量并赋值。经常写为 gen (**********************)stata 命令格式(**********************)  [by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options]  1。Command 命令动词，经常用缩写。  2。varlist 表示一个变量或者多个变量，多个变量之间用空格隔开。如 sum price weight  3。 by varlist 分类信息按照某一变量的不同特性分类  4。 =exp 赋值及运算  5。 if exp 挑选满足条件的数据  6。 in range 对数据进行范围筛选  7。 Weight 给数据赋一个权重  8。 , options 命令增加一些可选信息 Label define marry 1 ”married” 0 ”unmarried” 第二讲： (**********************)建立回归方程(**********************)  Regress 命令详解：  Regress depvar [indepvars] [if] [in] [weight] [, options]  打开系统文件 auto，建立如下方程： sysuse auto,clear regress price mpg weight foreign  1。要求方程省略常数项(自己设置常数项) Reg price mpg weight foreign , nocons (hascons)  2。稳健性估计（一般用于大样本 OLS） Reg price mpg weight foreign , vce (robust) 或者：reg price mpg weight foreign, r （常用的） 3。设置置信区间（默认 95%） reg price mpg weight foreign, level(99)（数字可以变）  4。标准化系数  reg price mpg weight foreign, beta  5。部分数据回归  reg price mpg weight length foreign in 1/30  reg price mpg weight length if foreign==0 (**********************)回归后预测值的获得(**********************)  Predict  1。拟合值的获得：  predict yhat, xb 或者 predict yhat 获取拟合值并将拟合值 y 定义为 yhat  2。残差的获得  predict e , residuals 或者 predict e, res 获得残差并把残差定义为 e (**********************)回归的假设检验(**********************) (**********************)test 命令(**********************)  例二： use wage2, clear  reg lnwage educ tenure exper expersq  1。教育（educ）和工作时间（tenure）对工资的影响相同。  test educ=tenure （两个变量的系数是否相等）  2。工龄（exper）对工资没有影响  test exper （检验 exper 的系数是否为 0）或者 test exper =0  3。检验 educ 和 tenure 的联合显著性 test educ tenure（检验两个变量的系数是否同时为 0）或者 test (educ=0) (tenure=0) (**********************)非线性检验：testnl(**********************)  例一 .  sysuse auto  gen weight2 = weight^2  reg price mpg trunk length weight weight2 foreign  testnl _b[mpg] = 1/_b[weight]（非线性关系下，在需要写成_b[变量名]的形式）  testnl (_b[mpg] = 1/_b[weight]) (_b[trunk] = 1/_b[length]) (**********************)约束回归(**********************)  定义约束条件  constraint define n 条件  约束回归语句  cnsreg 被解释变量解释变量, constraints(条件编号)  例二：use nerlove,clear  cons def 1 lnpl+lnpk+lnpf=1  . cons def 2 lnq=1  . cnsreg lntc lnq lnpl lnpk lnpf, c(1-2) 第三讲： (**********************)异方差(**********************) (**********************)异方差的检验(**********************)  1。残差图：  rvfplot （residual-versus-fitted plot）（残差与拟合值的散点图）  rvpplot 变量名（residual-versus-predictor plot）（残差与解释变量的散点图）  作图命令一定要在回归完成之后进行  Reg y x1 x2 x3  Rvpplot  Rvpplot x1（残差与 x1 的散点图）  2。怀特检验命令：  做完回归后，使用命令：  estat imtest, white(imtest 指的是：information matrix test 信息矩阵检验)  3。BP 检验：做完回归后，使用命令：  estat hettest ,normal（使用拟合值 yˆ ）  estat hettest,rhs （使用方程右边的解释变量，而不是 yˆ ）  estat hettest [varlist] （指定使用某些解释变量）  最初的 BP 检验假设扰动项服从正态分布，有一定局限性。Koenker（1981）将此假定放松为 iid，在实际中较多采用，其命令为：  estat hettest, iid  estat hettest, rhs iid estat hettest [varlist],iid (**********************)异方差的处理(**********************)  异方差的处理如果考得话我感觉考到使用“异方差稳健标准差”的可能性比较高。但是只有记住参数，,r 就一切 OK 了。  1。使用“异方差稳健标准差”（robust standard error）：这是最简单，也是目前比较流行的方法。只要样本容量较大，即使在异方差的情况下，只要使用稳健标准差，则所有参数估计、假设检验均可照常进行。  sysuse nlsw88, clear  reg wage ttl_exp race age industry hours  reg wage ttl_exp race age industry hours, r 使用稳健标准差  2。广义最小二乘法（GLS）、加权最小二乘法（WLS）以及可行广义最小二乘法（FGLS）。  其含义为  Var(b) = (X'X)-1*(X'ΩX)* (X'X)-1 通过加权使得 Ω=I  因此，GLS 和 WLS 要求 Ω 已知。例如：假设我们知道异方差是由变量 weight 引起。 sysuse auto, clear  gen wei2 = weight^2  reg price mpg weight turn foreign [aw=1/wei2]设置权重 aw 为 weight 的平方的倒数  rvpplot weight （去年王永画的范围内明确指明 FGLS 不考！！！） FGLS 的步骤  (1) 对原方程用 OLS 进行估计，得到残差项的估计 ûi ，  (2) 计算 ln(ûi2)  (3) 用 ln(û2)对所有独立的解释变量进行回归，然后得到拟合值 ĝi  (4) 计算 ĥi = exp(ĝi)  (5) 用 1/ ĥi 作为权重,做 WLS 回归。  Reg y x1 x2 x3„„  predict u,res  gen lnu2=ln(u^2)  reg lnu2 x1 x2…  predict g,xb  gen h=exp(g)  gen invvar=1/h  reg y x1 x2…*aweight=invvar+ (**********************)自相关 (**********************)  考察英国政府如何根据长期利率（r20）的变化来调整短期利率（rs），数据集为 ukrates.dta （1）做如下回归：，其中：  回归方程为： use ukrates,clear tsset month reg D.rs LD.r20 “L.”滞后算子 “L2.”滞后两阶 “D.”一阶差分算子 “D2.”D2.X=Xt-Xt-2 “LD.”表示一阶差分的滞后值或者滞后值的一阶差分  1。图形法：自相关系数和偏自相关系数 predict e1,res ac e1（e1 的自相关系数） pac e1（e1 的偏自相关系数） corrgram e1,lag(10)  2。t 检验和 F 检验(wooldridge)  思想：t 检验，如果存在一阶自相关，残差项与其一阶滞后项回归后系数显著，如果解释变量非严格外生，回归时可加入解释变量。 reg e1 L.e1 reg e1 L.e1 LD.r20 同理，可以用 F 检验检验是否存在高阶自相关 reg e1 L(1/2).e1  3。DW 检验：只能检验一阶自相关的序列相关形式，并且要求解释变量严格外生。 reg D.rs LD.r20 dwstat  4。Q 检验和 Bartlett 检验 reg D.rs LD.r20 predict e2,res(得到回归残差命名为 e2) wntestq e2（使用 stata 提供的默认的滞后期） wntestq e2,lag(2)（使用指定数字的滞后期此处为滞后 2 期） wntestb e2（对 e2 进行 bartlett 检验注意这里是 wntestb 上面的是 wntestq）  5。D-W’s h 检验 estat durbinalt estat durbinalt,lag(2)指定两期 6。B-G 检验 bgodfrey bgodfrey,lag(2) ttt rrs   120 1 ttt rsrsrs 211 202020   ttt rrr (**********************)自相关的处理(**********************) 1。Newey 稳健性估计或者聚类稳健性估计。 reg D.rs LD.r20 newey D.rs LD.r20 ,lag(1)（HAC 标准差，必须指定滞后阶数 p） newey D.rs LD.r20 ,lag(2) 2．某些模型中可以通过取对数或者取差分消除自相关。（伟大的 FGLS 在时间紧迫的情况下依然可能或许保不齐说不定有可能又不需要看了） 3． FGLS 估计（一阶自相关）假设干扰项服从 AR(1)过程：一阶准差分。 Cochrane-Orcutt(1949) 估计(舍弃第一期观察值) prais D.rs LD.r20,corc prais D.rs LD.r20,rho(dw) corc Prais-Winsten(1954) 估计(对第一期观察值进行处理 sqrt(1-rho^2)*y1) prais D.rs LD.r20 prais D.rs LD.r20,rho(dw) 时间序列一般样本不会太大，因此不要轻易舍弃。 (**********************)模型的设定和筛选问题(**********************)  1。Link 检验。基本思想：如果模型的设定是正确的，那么 y 的拟合值的平方项将不应具有解释能力。  use wage1,clear  gen lnwage=ln(wage)  reg lnwage educ exper tenure  linktest （或许是遗漏了重要的解释变量）  gen educ2=educ^2  gen exper2=exper^2  reg lnwage educ exper tenure educ2 exper2  linktest 2。Ramsey 检验。基本思想：如果模型设定无误，那么拟合值和解释变量的高阶项都不应再有解释能力。 use wage1,clear reg lnwage educ exper tenure estat ovtest estat ovtest,rhs （或许是遗漏了重要的解释变量） gen educ2=educ^2 gen exper2=exper^2 reg lnwage educ exper tenure educ2 exper2 estat ovtest （传说又一次的出现了，伟大的上一级的师兄师姐的范围内再次明确指定嵌套模型和非嵌套模型貌似也可以去见耶稣了。） (**********************)嵌套模型和非嵌套模型(**********************)  1。嵌套模型（大模型好还是小模型好）方法 1： reg lnwage educ exper tenure reg lnwage educ exper tenure educ2 exper2 test educ2 exper2  方法 2：利用赤池信息准则和贝叶斯信息准则  选择最小的 AIC 和 BIC reg lnwage educ exper tenure estat ic reg lnwage educ exper tenure educ2 exper2 estat ic  2。非嵌套的 J 检验和 Cox 检验（两个方程包含的解释变量不相同或不完全相同）  reg lnwage educ exper tenure  reg lnwage educ exper exper2  nnest lnwage educ exper tenure(educ exper exper2) 多重共线性：多重共线性的检验：膨胀因子 estat vif 经验上当 (1) VIF 的均值 >=2  (2) VIF 的最大值接近或者超过 10 认为有较为严重的多重共线性。 reg price mpg weight length foreign estat vif 还可以利用解释变量的相关系数 pwcorr mpg weight length foreign (****************)逐步回归法分为逐步剔除和逐步加入(****************)  逐步剔除又分为逐步剔除(Backward selection)和逐步分层剔除(Backward hierarchical selection)  1。逐步剔除  注意：逐步提出是 pr 而逐步加入时 pe  stepwise, pr(显著性水平): 回归方程  例如：对 auto 数据  Stepwise,pr(0.05):reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign  2。逐个分层剔除  再次注意：分层加入的时候需要加上一个 hier 如下，你懂的  Stepwise,pr(0.05) hier:reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign  去掉 foreign 重新做一遍  逐步加入又分为逐步加入(Forward selection)和逐步分层加入(Forward hierarchical selection)  1。逐步加入  stepwise, pe(显著性水平): 回归方程  例如：对 auto 数据  Stepwise,pe(0.05):reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign  2。逐个分层加入  Stepwise,pe(0.05) hier:reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign （哎呀呀呀越来越感觉上级的师兄师姐们是多么的幸福啊！他们竟然也灰常灰常明确的指出残差分析和异常样本点的处理不考，唉时运不济，命途多舛啊！） (**********************)残差分析和异常样本点的处理(**********************) 1。残差序列是否服从正态分布 sysuse auto, clear reg price weight mpg turn foreign predict e, res kdensity e, normal pnorm e （对中间部位敏感） qnorm e （对尾部敏感） sktest e swilk e 2 对特殊样本点的检验和处理：离群样本点、杠杆样本点和关键样本点。  离群样本点：残差值较大的样本点  杠杆样本点：与样本整体(X‘X)很不相同的少数样本点  关键样本点: 对回归结果有重要影响的少数样本点  图形分析 sysuse auto, clear reg price weight mpg turn foreign lvr2plot（注意两条红线的含义） lvr2plot, mlabel(make) 离群值的获得 predict e1, res list make e1 杠杆值的获得 predict lev1, leverage list make lev1  关键样本点通常既是离群样本点又是杠杆样本点，用 DFITS 统计量和 DFBETA 统计量加以观察。  DFITS 统计量：经验临界值 2*sqrt(k/N) reg price weight mpg turn foreign predict d1,dfits dis 2*sqrt(5/74) list make price weight d1 if abs(d1)>0.51987524 sum price weight  通过排序方式找到离群样本点和杠杆值样本 predict lev2, leverage predict e, res gen e2 = e^2 gsort -lev2 list make price lev2 e2 in 1/10 gsort -e2 list make price lev2 e2 in 1/10 第四讲 (**********************)虚拟变量(**********************) 例子：引入虚拟变量之前 reg price weight reg price weight if foreign==0 reg price weight if foreign==1  1。仅截距发生变化。我们以国产还是进口作为虚拟变量，为了熟悉虚拟变量的产生过程，这里不用 foreign，而是产生一个新的虚拟变量 d1（虚拟变量的生成要灵活运用 gen 语句和 replace 语句）。 gen d1 = 0 replace d1 = 1 if foreign==1 注意哦！神奇的事情就在这里发生了！当 foreign==1 的时候要把 d1 赋值为 1 哦！！ reg price d1 weight 和前面做的回归比较，d1 反映了进口车和国产车常数项即截距的差异，斜率基本没有变化。  2。仅斜率发生变化。产生一个新的虚拟变量 d2。为了使斜率变化，产生一个交乘项 d2_weight。 gen d2 = 0 replace d2 = 1 if foreign==1 gen d2_weight=d2*weight reg price weight d2_weight 和前面做的回归比较，斜率有变化，截距的变化不显著。  3。截距斜率同时变化。产生一个新的虚拟变量 d3。为了使斜率同时变化，产生一个交乘项 d3_weight。 gen d3 = 0 replace d3 = 1 if foreign==1 gen d3_weight =d3*weight reg price d3 weight d3_weight 和前面做的回归比较，截距、斜率均有变化，但截距的变化不显著。 (**********************)Chow 检验(**********************)  考察 1978-2006 年中国居民人均消费与人均国内总产值数据（当年价格）。估计中国消费函数，并检验中国的消费函数是否在 1992 年邓小平“南巡”以后（含 1992 年）发生了结构变化。  方法一，利用虚拟变量 use consumption_china,clear gen d=(year>1991) （生成虚拟变量） gen yd=y*d （生成虚拟变量与 GDP 的互动项） reg c y d yd test d yd  方法 2：下载最新程序 chow findit chow chow c y,chow(year>1991) (**********************)格兰杰因果检验(**********************)  分别检验“消费是 GDP 的格兰杰因”与“GDP 是消费的格兰杰因”，将滞后期均设为 2 年。方法 1：  reg y L(1/2).c L(1/2).y test L.c L2.c reg c L(1/2).y L(1/2).c test L.y L2.y  方法 2：下载程序 gcause findit gcause gcause c y,lag(3) gcause y c,lag(3) (**********************)工具变量(**********************) (**********************)二阶段最小二乘法：2SLS(**********************)  主要思想：进行两阶段回归。  假设方程为： y=b1x1+b2x2+u 其中 x1 是外生变量，x2 是内生变量，找到两个变量 z1 和 z2，作为 x2 的工具变量。  第一阶段回归：reg x2 x1 z1 z2 x2 结合了 z1 和 z2 的信息，此时取出 x2 的拟合值 x2_hat。  例子：  Reg x2 x1 z1 z2  Predict x2_hat（将 x2 的拟合值定义为 x2_hat）  第二阶段回归： reg y x1 x2_hat (**********************)广义矩估计法：GMM(**********************)  基本思想：求解如下一般化目标函数,使之最小化 J(b_GMM) = n*g(b_GMM)'*W*g(b_GMM) 其中，W 为权重矩阵  在球型扰动项的假定下，2SLS 是最有效的。但如果扰动项存在异方差或自相关，则广义矩估计方法效果更好。  GMM 方法又分为两步 GMM 法和迭代 GMM 方法。  使用 grilic.dta 估计教育投资的回报率。  变量说明：lw80（80 年工资对数），s80（80 年时受教育年限），expr80（80 年时工龄），tenure80（80 年时在现单位工作年限）， iq（智商），med（母亲的教育年限）， kww（在‘knowledge of the World of Work’测试中的成绩），mrt（婚姻虚拟变量，已婚=1），age（年龄）。  建立方程： use grilic.dta,clear reg lw80 s80 expr80 tenure80 对方程进行分析：  1。遗漏变量问题：认为方程遗漏了“能力”这个变量，加入 iq（智商）作为“能力” 的代理变量。  2。测量误差问题：iq（智商）对“能力”的测量存在误差。  3。变量内生性问题：s80 可能与扰动项中除“能力”以外的其他因素相关，因此是内生变量。  解决方法：使用 med，kww，mrt，age 作为内生解释变量 iq 与 s80 的工具变量。  1。使用 2SLS。 ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first （看到了没？看到了没？括号里的内容是用工具变量 med kww mrt age 替代内生变量 s80 iq）  2。使用两步 GMM 。 ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age)  3。使用迭代 GMM 。 ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age),igmm （，igmm 是使用迭代 GMM 的标志哦！） (**********************)弱工具变量检验(**********************)  工具变量 Z 与 X 的相关性较低时，2SLS 估计量存在偏误，Z 称为“弱工具变量”。  检验方法： estat firststage 1。初步判断可以用偏 R2(partial R2) (剔除掉模型中原有外生变量的影响)。 2。 Minimum eigenvalue statistic(最小特征值统计量)，经验上此数应该大于 10。 ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first（, first 显示第一阶段的回归） estat firststage (**********************)过度识别检验(**********************)  检验工具变量是否与干扰项相关，即工具变量是否为外生变量。目前仅限于在过度识别的情况下，进行过度识别检验。  2SLS 根据 Sargan 统计量进行过度识别检验，GMM 使用 Hansen J Test 进行过度识别检验。命令均为： estat overid 检验工具变量的外生性 H0：所有工具变量都是外生的。 H1：至少有一个工具变量不是外生的，与扰动项相关。 ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat overid ivregress gmm lw80 expr80 tenure80 (s80 iq=med kww mrt age) estat overid  1。如果所有解释变量都是外生变量，则 OLS 比 IV 更有效。在这种情况下使用 IV，虽然估计量仍然是一致的，会增大估计量的方差。2。如果存在内生解释变量，则 OLS 是不一致的，而 IV 是一致的。  豪斯曼检验（Hausman specification test）原假设：  H0 ：所有解释变量均为外生变量。  H1：至少有一个解释变量为内生变量。 quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age) est store iv hausman iv ols （哎呀呀呀幸福时刻啊！！！咱们竟然也有不需要看的地方了！！！幸福中^_ !^） (**********************)极大似然估计(**********************)  MLE 的基本步骤  1. 推导最大似然函数  2. 编写似然函数的 stata 程序(可选：似然函数的一阶和二阶导数 d1,d2)  3. 设定解释变量和被解释变量： ml model 命令  4. 估计最大似然函数：ml maximize 命令  假设 x_i 服从均值为 mu, 标准差为 sigma^2 的正态分布。  cap program drop myprog  program define myprog  version 10.0  args lnf mu sigma  quietly replace `lnf' = ln(normalden($ML_y1, `mu', `sigma'))  end 第五讲： (**********************)面板数据基本命令(**********************)  1。指定个体截面变量和时间变量：xtset  2。对数据截面个数、时间跨度的整体描述：xtdes。(显示面板数据的结构是否为平衡面板)  3。对每个个体分别显示该变量的时间序列图： xtline。  4。静态面板数据基本回归命令：xtreg。调出一笔数据: use grunfeld,clear xtset company year（设置界面数据为 company，时间维度数据为 year） xtdes xtline invest (**********************)混合回归(**********************)  直接使用命令： reg invest mvalue kstock  一般是有偏的 (**********************)固定效应模型: (**********************)  方法 1：不需要得到具体的截距项。  xtreg invest mvalue kstock ,fe  方法 2：需要得到每个个体的截距项。  tab company , gen(dum) （这是批量产生虚拟变量的命令）  reg invest mvalue kstock dum*,nocons  实质：方法 1 实际上是用每个个体的观察值减去组内平均，去除掉个体效应，然后用 OLS 估计。 (**********************)Hausman 检验(**********************)  基本思想：由于在固定效应模型中，实际上是把 ui作为解释变量处理，因此并不要求 Cov(ui,Xit)=0。而在随机效应模型中，必须保证 Cov(ui,Xit)=0。  所以：  1。如果 Corr(a_i,x_it) = 0, Fe 和 Re 都是一致的，但，Re 更有效。 2。如果 Corr(a_i,x_it)!= 0, Fe 仍然一致，但 Re 是有偏的。因此原假设是 Corr(a_i,x_it) = 0，即应该采用随机效应。 xtreg invest mvalue kstock ,fe est store fixed （ext 貌似应该是 estate 吧） xtreg invest mvalue kstock ,re est store random hausman fixed random 本题接受原假设，即应该用随机效应。  Hausman 检验为负  解决办法：  hausman fixed random，sigmaless  hausman fixed random，sigmamore  这种情况一般要拒绝原假设，采用固定效应模型。  （happy time 到了非平衡面板如何处理这里是真真的不考啊„„）  2。非平衡面板如何处理？ use nlswork,clear xtset idcode year xtdes 这是一份典型的大 n 小 t 型非平衡面板数据。方法一：下载命令 xtbalance 提取成一个平衡面板数据，但不推荐使用，因为会损失大量样本。方法二：利用算法填补缺失值，需要经济理论和算法的支撑。  3。获取到的面板数据格式不符合要求的处理。  例如如下表格格式该如何处理？  处理方法：  扁平数据变长条数据的命令：reshape use invest2,clear edit reshape long invest kstock, i(company) j(year) (**********************)图形表示(**********************)  use grunfeld,clear  1。xtline invest  2。xtline invest,overlay  3。xtline invest mvalue kstock (**********************)其他回归方法 (**********************)  1。聚类稳健的标准差  通常可以假设不同个体之间的扰动项相互独立，但同一个体在不同时期的扰动项之间往往存在自相关。故须采用聚类稳健的标准差。 use grunfeld,clear xtset company year reg invest mvalue kstock,vce(cluster company) 同理有： xtreg invest mvalue kstock,fe vce(cluster company) xtreg invest mvalue kstock,re vce(cluster company) (**********************)组间估计法(**********************)  对于随机效应模型，还可以采用“组间估计量”。对于那些每个个体的时间序列数据较不准确或“噪音”较大的数据，可对每个个体取时间平均值，然后用平均值来回归。 xtreg invest mvalue kstock ,be(唉就是个参数的事儿„„) 由于损失了较多信息量，组间估计法并不常用。（额，极大似然估计就当没有从课本上出现过吧„„这个也不考） (**********************)极大似然估计(**********************)  如果随机效应模型中假设扰动项服从正态分布，则可以使用最大似然估计法（MLE）来进行估计。 xtreg invest mvalue kstock ,mle  与随机效应模型的估计比较结果几乎完全一致。  （谁让你是双向固定效应呢，唉算了吧也不用考了） (**********************)双向固定效应模型(**********************)  固定效应模型： Yit=ai+XitB+εit  双向固定效应模型：Yit=ai+ft+XitB+εit  实际上添加了 t-1 个时间虚拟变量。主要反应随着时间变化的一些特征。 tab year,gen(yr) edit drop yr1 xtreg invest mvalue kstock yr*,fe 大部分时间虚拟变量显著，说明随着时间的变动，invest 有不断变动的趋势。  检验：可以使用似然比检验。  原假设：时间虚拟变量不显著。 xtreg invest mvalue kstock ,fe est store fe1 xtreg invest mvalue kstock yr*,fe est store fe2 lrtest fe1 fe2 整体来看时间虚拟变量不够显著。 (**********************)异方差、序列相关和截面相关(**********************)  大 n 小 T 重点关注异方差  大 T 小 n 重点关注序列相关  由于面板数据同时兼顾了截面数据和时间序列的特征，所以异方差和序列相关必然会存在于面板数据中；同时，由于面板数据中每个截面（之间还可能存在内在的联系，所以，截面相关性也是一个需要考虑的问题。  1。异方差的检验(组间，一般不考虑组内)：  这里的数字要记清楚啊！跟后面的容易混！ findit xttest3 或者直接 ssc install xttest3 xtreg invest mvalue kstock ,fe xttest3  随机效应模型由于本身已经较大程度的考虑了异方差问题，主要体现在 sigma_u^2 上，因此不考虑异方差问题。  2。组内序列相关的检验：  固定效应： xtserial  基本思想：若无序列相关，则一阶差分后残差相关系数应为-0.5。 findit xtserial xtserial invest mvalue kstock xtserial invest mvalue kstock,output  随机效应：  findit xttest1  xtreg market stock invest, re  xttest1  3。截面相关的检验： ssc install xttest2 xtreg invest mvalue kstock ,fe xttest2  1。异方差的处理  xtreg invest mvalue kstock , fe robust  2。一阶自相关的处理  xtregar invest mvalue kstock , fe  3。高阶自相关的处理  findit newey2  newey2 invest mvalue kstock , lag(2)  4。截面相关的处理  xtreg invest mvalue kstock ,fe cluster(company)  xtreg invest mvalue kstock ,re cluster(company) (**********************)面板数据的 FGLS 估计(**********************)  命令一： xtgls 命令  1。假设方程不存在异方差、自相关和截面相关，模型可以采用混合OLS (Pooled OLS)。 xtgls invest mvalue kstock, panel(iid) 2。若模型存在异方差。 xtgls invest mvalue kstock, panel(het)  命令二：xtpcse 命令  1。 OLS 估计，面板稳健性标准差 xtpcse invest mvalue kstock 2。 Prais_Winsten 估计，个体具有共同的自相关系数 xtpcse invest mvalue kstock, corr(ar1) 3。每个截面有自己的自相关系数 xtpcse invest mvalue kstock, corr (psar1) 4。只考虑异方差，不考虑截面相关 xtpcse invest mvalue kstock, corr (ar1) hetonly 第六讲（额产生模拟数据，很神奇的被上一级里滑进了封杀的范围内。） (**********************)产生模拟数据(**********************)  1。产生一个 AR(1)的平稳时间序列：  sim_arma ar_1, ar(0.9) nobs(300)  2。产生一个 MA(1)的时间序列：  sim_arma ma_1, ma(0.8) nobs(300)  3。产生一个 ARMA(1,1)的模型：  sim_arma arma_11, ar(0.8) ma(0.5) nobs(300)  4。产生两个随机游走过程  sim_arma ar_2, ar(1) nobs(300)  sim_arma ar_3, ar(1) nobs(300)  将文件保存起来  1。画出时间序列的趋势线：  line ar_1 _t,yline(0)  line ma_1 _t,yline(0)  line arma_11 _t,yline(0)  line ar_2 ar_3 _t,yline(0)  2。画出时间序列的相关图和自相关图  ac  pac  ARIMA 模型的估计  打开数据文件 mpyr.dta  1。产生实际货币的对数值，并画出各变量趋势图。  line logmr logy r year  2。检验 logmr 的平稳性 dfuller logmr

                    本文档为【stata命令(2010年)】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

stata命令(2010年)

你可能还喜欢