Stata에서 프로 빗 모델을 어떻게 해석합니까?


13

Stata에서 실행 한이 probit 회귀를 해석하는 방법을 잘 모르겠습니다. 데이터는 대출 승인 상태이며 흰색은 더미 변수로, 사람이 백인이면 = 1이고 사람이 그렇지 않은 경우 = 0입니다. 이것을 읽는 방법에 대한 도움을 주시면 감사하겠습니다. 내가 주로 찾고있는 것은 백인과 비백 인 모두에 대한 대출 승인 가능성을 찾는 방법입니다. 누군가가 여기에있는 텍스트와 그것을 정상적으로 만드는 방법을 알려줄 수 있습니까? 어떻게해야할지 모르겠습니다.

. probit approve white

Iteration 0:   log likelihood = -740.34659  
Iteration 1:   log likelihood = -701.33221  
Iteration 2:   log likelihood = -700.87747  
Iteration 3:   log likelihood = -700.87744  

Probit regression                                 
Number of obs   =       1989

LR chi2(1)      =      78.94

Prob > chi2     =     0.0000

Log likelihood = -700.87744                       

Pseudo R2       =     0.0533

변수 흰색의 경우 :

Coef.: .7839465  
Std. Err.: .0867118  
z: 9.04  
P>|z|: 0.000  
95% Conf. Interval: .6139946-.9538985  

상수의 경우 :

Coef.: .5469463  
Std. Err.: .075435  
z: 7.25  
P>|z|: 0.000  
95% Conf. Interval: .3990964-.6947962  

답변:


44

일반적으로, 프로 빗 회귀 출력의 계수를 해석 할 수는 없습니다 (적어도 표준적인 방법은 아님). 회귀 변수 의 한계 효과 , 즉 회귀 변수 값을 변경할 때 결과 변수의 (조건부) 확률이 얼마나 변하는 지 해석하고 다른 모든 회귀 변수를 일정한 값으로 유지해야합니다. 이는 추정 계수를 직접 해석하는 선형 회귀 분석과 다릅니다. 이것은 선형 회귀의 경우 회귀 계수 가 한계 효과 이기 때문입니다 .

프로 빗 회귀 분석에서는 일단 프로 빗 회귀 적합을 계산 한 후 한계 효과를 얻기 위해 필요한 추가 계산 단계가 있습니다.

선형 및 프로 빗 회귀 모델

  • 프로 빗 회귀 : 프로 빗 모델에서는 "성공적인"결과, 즉 , 의 (조건부) 확률을 모델링하고 있음을 상기하십시오 여기서 는 표준 정규 분포의 누적 분포 함수. 이것은 기본적으로 회귀 변수에 따라 결과 변수 가 1 일 확률은 회귀 변수 의 선형 조합의 특정 함수 라고 말합니다 .Yi=1

    P[Yi=1X1i,,XKi;β0,,βK]=Φ(β0+k=1KβkXki)
    Φ()Yi
  • 선형 회귀 : 이것을 선형 회귀 모델과 비교합니다.

E(YiX1i,,XKi;β0,,βK)=β0+k=1KβkXki
결과의 (조건부) 평균은 회귀 변수의 선형 조합입니다.

한계 효과

선형 회귀 모델 이외의 계수는 직접적인 해석이 거의 없습니다. 우리는 일반적으로 결과 변수의 특징에 영향을 미치는 회귀 변수의 변화 에 의한 ceteris paribus 효과에 관심 이 있습니다. 이것은 한계 효과가 측정하는 개념입니다.

  • 선형 회귀 : 이제 회귀 중 하나를 움직일 때 결과 변수 의 평균 이 얼마나 많이 움직이는 지 알고 싶습니다.

E(YiX1i,,XKi;β0,,βK)Xki=βk

그러나 이것은 회귀 계수에 불과합니다. 즉, 번째 회귀 분석 에서 변화의 한계 효과 는 회귀 계수 일뿐입니다.k

  • 프로 빗 회귀 : 그러나 이것이 프로 빗 회귀의 경우가 아님을 쉽게 알 수 있습니다

P[Yi=1X1i,,XKi;β0,,βK]Xki=βkϕ(β0+k=1KβkXki)
이다 하지 회귀 계수와 동일. 이는 프로 빗 모델 의 한계 효과 와 그 이후의 수량입니다. 특히, 이것은 다른 모든 회귀 변수의 값과 회귀 계수에 따라 다릅니다. 여기서 는 표준 정규 확률 밀도 함수입니다.ϕ()

이 수량을 계산하는 방법은 무엇이며이 공식을 입력해야하는 다른 회귀 분석기의 선택 사항은 무엇입니까? 고맙게도, Stata는 프로 빗 회귀 후이 계산을 제공하고 다른 회귀 분석기의 선택에 대한 일부 기본값을 제공합니다 (이 기본값에 대한 보편적 인 합의는 없습니다).

이산 회귀

우리가 미적분학을 사용했기 때문에 위의 많은 부분이 연속 회귀 분석의 경우에 적용됩니다. 불연속 회귀 분석의 경우 불연속 변경을 사용해야합니다. 예를 들어 값을 취하는 회귀 의 불연속 변화 는Xki{0,1}

ΔXkiP[Yi=1X1i,,XKi;β0,,βK]=βkϕ(β0+l=1k1βlXli+βk+l=k+1KβlXli)βkϕ(β0+l=1k1βlXli+l=k+1KβlXli)

Stata의 계산 한계 효과

프로 빗 회귀 : 다음은 Stata에서 프로 빗 회귀 후 한계 효과를 계산하는 예입니다.

webuse union   
probit union age grade not_smsa south##c.year
margins, dydx(*)

다음은 margins명령 에서 얻을 수있는 결과입니다.

. margins, dydx(*)

Average marginal effects                          Number of obs   =      26200
Model VCE    : OIM

Expression   : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |    .003442    .000844     4.08   0.000     .0017878    .0050963
       grade |   .0077673   .0010639     7.30   0.000     .0056822    .0098525
    not_smsa |  -.0375788   .0058753    -6.40   0.000    -.0490941   -.0260634
     1.south |  -.1054928   .0050851   -20.75   0.000    -.1154594   -.0955261
        year |  -.0017906   .0009195    -1.95   0.051    -.0035928    .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.

예를 들어 age변수 의 한 단위 변화로 인해 결합 상태 확률이 0.003442 증가 한다고 해석 할 수 있습니다 . 마찬가지로, 남쪽으로부터 되 감소 0.1054928하여 연합 상태 확률

선형 회귀 : 최종 점검으로 선형 회귀 모델의 한계 효과가 회귀 계수와 동일하다는 것을 확인할 수 있습니다 (한 번의 작은 꼬임). 다음 회귀 분석을 실행 한 후 한계 효과 계산

sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)

회귀 계수를 돌려줍니다. Stata 가 모형에 포함 된 경우 2 차 항을 통한 효과를 포함하여 회귀 의 한계 효과를 계산한다는 흥미로운 사실에 주목하십시오 .

. margins, dydx(*)

Average marginal effects                          Number of obs   =         74
Model VCE    : OLS

Expression   : Linear prediction, predict()
dy/dx w.r.t. : weight foreign

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0069641   .0006314   -11.03   0.000    -.0082016   -.0057266
     foreign |    -2.2035   1.059246    -2.08   0.038    -4.279585   -.1274157
------------------------------------------------------------------------------

불연속 회귀 분석 사례에 대한 대한 표현 이 잘못되었다고 생각합니다. 당신의 유도체의 차이 복용 하지만 차이되어야 . RHS의 두 번째 용어 일뿐 음수 부호는 없어야합니다. ΔXkP[Y=1]P[Y=1]
Ravi

1

또한 더 간단히 말하면, 프로 빗 회귀 분석의 계수는 "연령의 1 단위 증가 는 노조에있을 확률에 대한 z- 점수 의 증가에 해당합니다"( 링크 참조 ) 로 해석 될 수 있습니다 .βage

. webuse union

. keep union age grade

. probit union age grade

Iteration 0:   log likelihood =  -13864.23  
Iteration 1:   log likelihood = -13796.359  
Iteration 2:   log likelihood = -13796.336  
Iteration 3:   log likelihood = -13796.336  

Probit regression                               Number of obs     =     26,200
                                                LR chi2(2)        =     135.79
                                                Prob > chi2       =     0.0000
Log likelihood = -13796.336                     Pseudo R2         =     0.0049

------------------------------------------------------------------------------
       union |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |   .0051821   .0013471     3.85   0.000     .0025418    .0078224
       grade |   .0373899   .0035814    10.44   0.000     .0303706    .0444092
       _cons |  -1.404697   .0587797   -23.90   0.000    -1.519903   -1.289491
------------------------------------------------------------------------------

그런 다음

predict yhat

그리고 obs 1의 경우 적합치는 . 에 해당 플러그 대응하는 확률을 반환 funciton :βage20+βgrade12+βconsnormal()

di normal(.0051821*20 + .0373899*12 + -1.404697)
.19700266

따라서, 1 단위 증가 연령 (A)에 대응 조합에있는 확률의 z 점수가 증가한다.βage

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.