일반적으로, 프로 빗 회귀 출력의 계수를 해석 할 수는 없습니다 (적어도 표준적인 방법은 아님). 회귀 변수 의 한계 효과 , 즉 회귀 변수 값을 변경할 때 결과 변수의 (조건부) 확률이 얼마나 변하는 지 해석하고 다른 모든 회귀 변수를 일정한 값으로 유지해야합니다. 이는 추정 계수를 직접 해석하는 선형 회귀 분석과 다릅니다. 이것은 선형 회귀의 경우 회귀 계수 가 한계 효과 이기 때문입니다 .
프로 빗 회귀 분석에서는 일단 프로 빗 회귀 적합을 계산 한 후 한계 효과를 얻기 위해 필요한 추가 계산 단계가 있습니다.
선형 및 프로 빗 회귀 모델
프로 빗 회귀 : 프로 빗 모델에서는 "성공적인"결과, 즉 ,
의 (조건부) 확률을 모델링하고 있음을 상기하십시오
여기서 는 표준 정규 분포의 누적 분포 함수. 이것은 기본적으로 회귀 변수에 따라 결과 변수 가 1 일 확률은 회귀 변수 의 선형 조합의 특정 함수 라고 말합니다 .Yi=1
P[Yi=1∣X1i,…,XKi;β0,…,βK]=Φ(β0+∑k=1KβkXki)
Φ(⋅)Yi
선형 회귀 : 이것을 선형 회귀 모델과 비교합니다.
E(Yi∣X1i,…,XKi;β0,…,βK)=β0+∑k=1KβkXki
결과의 (조건부) 평균은 회귀 변수의 선형 조합입니다.
한계 효과
선형 회귀 모델 이외의 계수는 직접적인 해석이 거의 없습니다. 우리는 일반적으로 결과 변수의 특징에 영향을 미치는 회귀 변수의 변화 에 의한 ceteris paribus 효과에 관심 이 있습니다. 이것은 한계 효과가 측정하는 개념입니다.
- 선형 회귀 : 이제 회귀 중 하나를 움직일 때 결과 변수 의 평균 이 얼마나 많이 움직이는 지 알고 싶습니다.
∂E(Yi∣X1i,…,XKi;β0,…,βK)∂Xki=βk
그러나 이것은 회귀 계수에 불과합니다. 즉, 번째 회귀 분석 에서 변화의 한계 효과 는 회귀 계수 일뿐입니다.k
- 프로 빗 회귀 : 그러나 이것이 프로 빗 회귀의 경우가 아님을 쉽게 알 수 있습니다
∂P[Yi=1∣X1i,…,XKi;β0,…,βK]∂Xki=βkϕ(β0+∑k=1KβkXki)
이다
하지 회귀 계수와 동일. 이는 프로 빗 모델 의
한계 효과 와 그 이후의 수량입니다. 특히, 이것은 다른 모든 회귀 변수의 값과 회귀 계수에 따라 다릅니다. 여기서 는 표준 정규 확률 밀도 함수입니다.
ϕ(⋅)
이 수량을 계산하는 방법은 무엇이며이 공식을 입력해야하는 다른 회귀 분석기의 선택 사항은 무엇입니까? 고맙게도, Stata는 프로 빗 회귀 후이 계산을 제공하고 다른 회귀 분석기의 선택에 대한 일부 기본값을 제공합니다 (이 기본값에 대한 보편적 인 합의는 없습니다).
이산 회귀
우리가 미적분학을 사용했기 때문에 위의 많은 부분이 연속 회귀 분석의 경우에 적용됩니다. 불연속 회귀 분석의 경우 불연속 변경을 사용해야합니다. 예를 들어 값을 취하는 회귀 의 불연속 변화 는Xki{0,1}
ΔXkiP[Yi=1∣X1i,…,XKi;β0,…,βK]=βkϕ(β0+∑l=1k−1βlXli+βk+∑l=k+1KβlXli)−βkϕ(β0+∑l=1k−1βlXli+∑l=k+1KβlXli)
Stata의 계산 한계 효과
프로 빗 회귀 : 다음은 Stata에서 프로 빗 회귀 후 한계 효과를 계산하는 예입니다.
webuse union
probit union age grade not_smsa south##c.year
margins, dydx(*)
다음은 margins
명령 에서 얻을 수있는 결과입니다.
. margins, dydx(*)
Average marginal effects Number of obs = 26200
Model VCE : OIM
Expression : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
age | .003442 .000844 4.08 0.000 .0017878 .0050963
grade | .0077673 .0010639 7.30 0.000 .0056822 .0098525
not_smsa | -.0375788 .0058753 -6.40 0.000 -.0490941 -.0260634
1.south | -.1054928 .0050851 -20.75 0.000 -.1154594 -.0955261
year | -.0017906 .0009195 -1.95 0.051 -.0035928 .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.
예를 들어 age
변수 의 한 단위 변화로 인해 결합 상태 확률이 0.003442 증가 한다고 해석 할 수 있습니다 . 마찬가지로, 남쪽으로부터 되 감소 0.1054928하여 연합 상태 확률
선형 회귀 : 최종 점검으로 선형 회귀 모델의 한계 효과가 회귀 계수와 동일하다는 것을 확인할 수 있습니다 (한 번의 작은 꼬임). 다음 회귀 분석을 실행 한 후 한계 효과 계산
sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)
회귀 계수를 돌려줍니다. Stata 가 모형에 포함 된 경우 2 차 항을 통한 효과를 포함하여 회귀 의 순 한계 효과를 계산한다는 흥미로운 사실에 주목하십시오 .
. margins, dydx(*)
Average marginal effects Number of obs = 74
Model VCE : OLS
Expression : Linear prediction, predict()
dy/dx w.r.t. : weight foreign
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0069641 .0006314 -11.03 0.000 -.0082016 -.0057266
foreign | -2.2035 1.059246 -2.08 0.038 -4.279585 -.1274157
------------------------------------------------------------------------------