Stata做回归分析常用命令

04-23 8991阅读 0评论

Stata命令大荟

连续滚屏显示命令运行结果:set more off

恢复分页显示命令运行结果:set more on

罗列第11-15个观测值:list s lnw in 11/15

列出满足条件的数据:list s lnw if s>=16

删除满足条件的观测值:drop if s>=16

只想保留满足条件的观测值:keep if s>=16

将数据按照变量s升序排列:sort s \\ list

将数据按照变量s降序排列:gsort -s \\ list

 

 

画图:

直方图:hist s,width(1)freq

散点图:sc lnw s

定义标签画散点图:gen n=_n \\ scatter lnw s,mlabel(n)

显示变量s的统计指标:sum s

显示变量s的经验累积分布函数:ta s

显示相关系数:pwcorr lnw s exper,sig star(.05)

总体回归线、样本回归线和散点图:

twoway function PRF=1+2*x,range(-5,15)||scatter y x||lift y x,lp(dash)

时间趋势图:twoway connect y time,msymbol(circle)yaxis(1)||connect x time,msymbol(triangle)yaxis(2)

Twoway connect y x time,msymbol(circle)msymbol(triangle)xlabel(20(5)50)xline(35)

自相关散点图:predict e1//twoway scatter e1 L.e1||lift e1 L.e1

自相关图:ac e1

 

 

生成新的变量:

对数:gen lns=log(s)

平方项:gen s2=s^2

虚拟变量:gen college=(s>=15)

s与expr的互动项:gen exprs=s*expr

根据对数计算水平:gen w=exp(lnw)

重新命名:ren colleg college

定义范围的修改:replace college=(s>=5)

删除以s开头的所有变量:drop s*

计算功能:dis log(2)

存为日志:log using today

生成解释变量的系数:display b=_b[x]

储存解释变量的系数:scalar b=_b[x]

 

检验:

检验联合显著性:test x1=x2=0

一元线性回归蒙特卡罗模拟:clear // set obs 20// set seed 10101//gen x=rnormal(2,9)//gen e=rnormal(0,9)//gen y=1+2*x+e//reg y x

大样本理论的蒙特卡罗模拟:program chi2data,rclass//set obs 20//gen x=rchi2(1)//gen y=1+2*x+chi2(10)-10//reg y x//return scalar b=_b[x]//end

异方差BP检验:estat hettest,iid(以被解释变量的拟合值)//Estat hettest,iid rhs(以全部解释变量)//Estat hettest x,iid(以x)

异方差怀特检验:Estat imtest,white

自相关BG检验:tsset year//estat bgodfrey

自相关BG检验(不以0为缺失值):tsset year//estat bgodfrey,nomiss0

自相关Q检验:predict e1,r//wntestq e1

自相关(co法)Q检验predict e1,r//corrgram e1

自相关DW检验:estat dwatson

遗漏非线性项RESET检验:estat ovtest(拟合值的高次项)//estat ovtest,rhs(解释变量的高次项)

多重共线性VIF检验:estat vif

极端数据的LEV检验:predict lev,leverage//sum lev//display r(max)/r(mean)//replace lnq=lnq*100 if_n==1

结构变动检验:gen d=(year>1990)//xd=x*d//reg y x d xd//test d xd(检验联合显著性)

邹检验(同方差、物资相关(球形扰动项)):reg y x//scalar ssr=e(rss)//reg y x if year=1992//scalar ssr2=e(rss)//dis ((ssr-ssr1-ssr2)/K)/((ssr1+ssr2)/(n-2k))(K为有约束回归的参数个数(含常数项)、n为样本容量)

传统的豪斯曼检验(同方差,无自相关)FEorRE:quietly xtreg y x1 x2,fe//estimates store FE//quietly xtreg y x1 x2,re//estimates store RE//hausman FE RE,constant sigmamore

xtoverid命令来进行稳健的豪斯曼检验:

Ssc install xtoverid//quietly xtreg y x1 x2,re r//xtoverid

工具变量外生性的检验:ivregress 2sls y x1 x2 x3 (x4=z1 z2),r//estate overid

工具变量弱工具变量检验:ivregress 2sls y x1 x2 x3 (x4=z1 z2)(非稳健的F检验)//estat first

2sls和ols的豪斯曼检验:ivregress 2sls y x1 x2 x3(x4=z1 z2)//estimates store iv//reg y x1 x2 x3 x4//estimates store ols//hausman iv ols,constant sigmamore

异方差稳健的DWH检验:estat endogenous

 

 

 

处理:

异方差WLS处理:reg y x1 x2 x3//predict e1,r//gen e2=e1^2//gen lne2=log(e2)//reg lne2 y//reg lne2 y//predict lne2f///(option xb assumed;fitted values)//gen e2f=exp(lne2f)//reg y x1 x2 x3[aw=1/e2f],r

异方差自相关稳健的HAC标准误:newey y x1 x2 x3,lag(n^1/4)//newey y x1 x2 x3,lag(2*n^1/4)// 

自相关下FGLS处理CO法:prais y x1 x2 x3,corc

自相关下FGLS处理PW法:prais y x1 x2 x3,nolog(不显示迭代过程)

自相关滞后一期处理:reg y x1 L.x1 x2 x3

面板数据的处理:xtset state year//xtline year(查看被解释变量lny随时间year变动)

混合回归://reg y x1 x2,vce(cluster)

随机效应re r thete和mle处理://xtreg y x1 x2,re r theta(随机效应FGLS稳健)//xtset0(BP检验随机效应是否存在(xtreg,re之后))//xtreg y x1 x2,mle nolog

组内估计量的固定效应:xtreg y x1 x2,fe r

组内虚拟变量的固定效应模型:xtreg y x1 x2 i.state,fe r

LSDV法估计单向固定效应:reg y x1 x2 i.state,vce(cluster state)

时间趋势项双向固定效应:xtreg y x1 x2 t,fe r

组内估计虚拟变量双向效应:xtreg y x1 x2 i.year,fe r

FD法一阶差分估计固定效应模型:xtserial y x1 x2,output

组间估计随机效应:xtreg y x1 x2,be

两阶段的工具变量法:ivregress 2sls y x1 x2 x3 (x4=z1 z2),r first(显示第一阶段的结果)

Liml对数据不敏感的工具变量法:ivregress liml y x1 x2 x3 (x4=z1 z2),r 

 

 

生成报告:

estimates table ols_no_iq ols_with_iq tsls liml,b se(显示回归系数和标准误)

estimates table ols_no_iq ols_with_iq tsls liml,star(0.1 0.05 0.01)(只显示回归系数加星号)

ssc install estout

esttab ols_no_iq ols_with_iq tsls liml,se r2 mtitle star(*0.1**0.05***0.01)(显示显示回归系数、标准误和星号)

esttab ols_no_iq ols_with_iq tsls liml using iv.rtf,se r2 mtitle star(*0.1**0.05***0.01)(输出到word文件里)

有本文以外的需要可以查帮助文档:help 

 

以下是陈强版的计量经济学的习题部分命令,仅供参考,没有大小写之分,暂时没有注解可能需要自己先做一遍,再总结~

一元线性回归

4.7Galton.dta

Sum child parent

Twoway Scatter child parent||lift child parent

Gen lnc=log(child)

Reg lnc parent

Gen parent_dev=parent-父母身高均值

Gen gengap=child-parent

Reg gengap parent_dev

 

 

4.8蒙特卡罗模拟

Clear

Set obs 100

Set seed 10101

Gen x=rnormal(3,4)

Gen e=rnormal(0,9)

Gen y=1+2*x+e

Reg y x

影响标准误的因素:样本增大或x的方差增大,x/e的估计系数标准误减小;e的方差增大,x/e的估计系数标准误增大

 

 

多元线性回归

5.5airq.dta

Reg airq vala rain coast density income

Test income=0

Test income=density=0

Test income=density=vala=rain=coast

 

 

5.6 geodata_short.dta

Reg gdpg6590 lgdp65 syr1965

 reg gdpg6590 lgdp65

 reg gdpg6590 syr1965

收敛:系数是负值且显著

 

5.7woody3.dta

 

大样本OLS

1.nerlove.dta

 reg lntc lnq lnpf lnpk lnpl

Dis 1/_b[lnq](lnq系数估计值的倒数[规模报酬])

Test lnq=1(规模报酬不变)

 reg lntc lnq lnpf lnpk lnpl,r

display 1/_b[ lnq ]

test lnq=1

 

 

 

大样本理论的蒙特卡罗模拟

Program chi2data,rclass(定义程序chi2data,以r()形式储存)

Drop_all(删除已有数据)

Set obs 20 

gen x=rchi2(1)(生成卡方分布的解释变量)

Gen y=1+2*x+rchi2(10)-10

Reg y x

Retuen scalar b=_b[x](存储系数估计值)

End 

异方差

7.2hprice2a.dta

quietly reg lprice lnox ldist rooms stratio

Estat hettest,iid(以被解释变量的拟合值)

Estat hettest,iid rhs(以全部解释变量)

Estat imtest,white

Predict e1,r

Gen e2=e1^2

Gen lne2=log(e2)

Reg lne2 lprice

Reg lne2 lprice,noc

Predict lne2f

(option xb assumed;fitted values)

Gen e2f=exp(lne2f)

Reg lprice lnox ldist rooms stratio[aw=1/e2f],r

 

 

7.3food.dta

Twoway scatter food_exp income||lift food_exp income

Reg food_exp income

Estat hettest,iid

Estat hettest,iid rhs

Estat hettest,iid

Estat hettest income,iid

Estat imtest,white

Twoway scatter food_share income||lift food_share income

Reg food_share income

Estat hettest,iid

Estat hettest,iid rhs

Estat hettest income,iid

Estat imtest,white

 

 

自相关

Icecream.dta

 

Tsset time

Twoway connect consumpion time,msymbol(circle)yaxis(1)||connect temp time,msymbol(triangle)yaxis(2)

Reg consumption temp price income

Predict e1,r

Twoway scatter e1 l.e1||lift e1 l.e1

Twoway scatter e1 l2.e1||lift e2 l2.e1

Ac e1

Estat bgodfrey

Estat bgodfrey,nomiss0

Wntestq e1

Corrgram e1

Estat dwatson

Newey consumption temp price income,lag(3)

newey consumption temp price income,lag(6)

prais consumption temp price income,corc

prais consumption temp price income,nolog

 reg consumption temp L.temp price income

 estat bgodfrey

estat dwatson

 

 

模型设定与数据问题

9.3nerlove

Reg lntc lnq lnpl lnpk lnpf,r

 estat vif 

estat ovtest

estat ovtest,rhs

Gen lnq2=lnq^2

Reg lntc lnq lnq2 lnpl lnpk lnpf,r

Estat ovtest,rhs(再次检验)

 

 

9.4 growth.dta

twoway scatter growth tradeshare||lfit growth tradeshare

 reg growth tradeshare

Predict lev,leverage

Sum lev

Dis r(max)/r(mean)

drop if country_name==’Malta’

reg growth tradeshare rgdp yearsschool rev_coups assasinations if _n1973)

Gen llgasqd=l.gasq*d

Gen lincomed=licome*d

Gen lgasp=lgasp*d

Gen lpncd=lpnc*d

Gen lpucd=lpuc*d

Reg lgasq l.lgasq lincome lgasp lpnc lpuc d llgasqd lincomed lgaspd lpncd lpucd,r

Test d llgasqd lincomed lgaspd lpncd lpucd

该模型存在异方差,不存在自相关,因此传统的邹检验不成立,需使用虚拟变量法检验是否存在结构变动

 

工具变量法

Grilic.dta

reg lnw s expr tenure rns smsa,r

reg lnw s iq expr tenure rns smsa,r

ivregress 2sls lnw s expr tenure rns smsa (iq=med kww),r First

estat overid

quietly ivregress 2sls lnw s expr tenure rns smsa (iq=med kww)(弱工具变量检验普通的F统计量)

Estat first

ivregress liml lnw s expr tenure rns smsa (iq=med kww),r(对若工具变量更不敏感的有限信息最大似然法)

quietly reg lnw s iq expr tenure rns smsa

estimates store ols

quietly ivregress 2sls lnw s expr tenure rns smsa (iq=med kww)

estimates store iv

hausman iv ols,constant sigmamore

estat endogenous(适用于异方差稳健的DWH检验)

汇报结果

qui reg lnw s expr tenure rns smsa,r

estimates store ols_no_iq

qui reg lnw s iq expr tenure rns smsa,r

estimates store ols_with_iq

quietly ivregress 2sls lnw s expr tenure rns smsa(iq=med kww),r

estimates store tsls

ivregress liml lnw s expr tenure rns smsa (iq=med kww),r

estimates store liml

estimates table ols_no_iq ols_with_iq tsls liml,b se(显示回归系数和标准误)

estimates table ols_no_iq ols_with_iq tsls liml,star(0.1 0.05 0.01)(只显示回归系数加星号)

ssc install estout

esttab ols_no_iq ols_with_iq tsls liml,se r2 mtitle star(*0.1**0.05***0.01)(显示显示回归系数、标准误和星号)

esttab ols_no_iq ols_with_iq tsls liml using iv.rtf,se r2 mtitle star(*0.1**0.05***0.01)(输出到word文件里)

面板数据

12.3munnell.dta

Xtset State year

Xtdes

Xtline lny

Reg lny lnk1 lnk2 lnlabor unemp,vce(cluster state)

Xtreg lny lnk1 lnk2 lnlabor unemp,re r theta

Xttest0

Xtreg lny lnk1 lnk2 lnlabor unemp,mle nolog

Xtreg lny lnk1 lnk2 lnlabor unemp,fe r

reg lny lnk1 lnk2 lnlabor unemp i,state,vce(cluster state)

Quietly xtreg lny lnk1 lnk2 lnlabor unemp,fe

Estimates store FE

Quietly xtreg lny lnk1 lnk2 lnlabor unemp,re

Estimates store RE

Hausman FE RE,constant sigmamore

Reg lny lnk1 lnk2 lnlabor unemp

Estat imtest,white

Ssc install xtoverid

Quietly xtreg lny lnk1 lnk2 lnlabor unemp,re r

xtoverid

Xtreg lny lnk1 lnk2 lnlabor unemp t,fe r

Xtreg lny lnk1 lnk2 lnlabor unemp i,year,fe r(在组内估计中)

Xtserial lny lnk1 lnk2 lnlabor unemp,output

Xtreg lny lnk1 lnk2 lnlabor unemp,be(随机模型的方法)

Estimates store FE

Esttab FE,b se mtitle keep(lnk1)

 

 

 


免责声明
1、本网站属于个人的非赢利性网站,转载的文章遵循原作者的版权声明。
2、本网站转载文章仅为传播更多信息之目的,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所
提供信息的准确性及可靠性,但不保证信息的正确性和完整性,且不对因信息的不正确或遗漏导致的任何
损失或损害承担责任。
3、任何透过本网站网页而链接及得到的资讯、产品及服务,本网站概不负责,亦不负任何法律责任。
4、本网站所刊发、转载的文章,其版权均归原作者所有,如其他媒体、网站或个人从本网下载使用,请在
转载有关文章时务必尊重该文章的著作权,保留本网注明的“稿件来源”,并白负版权等法律责任。

手机扫描二维码访问

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

发表评论

快捷回复: 表情:
评论列表 (暂无评论,8991人围观)

还没有评论,来说两句吧...

目录[+]