조건부 및 무조건 Quantile 회귀 분석의 차이점은 무엇입니까?


38

Quantile에 대한 Koenker and Basset (1978)의 조건부 Quantile 회귀 추정량 은 \ widehat {\ beta} _ {QR} = \ min_ {b} \ sum ^ {n} _ {i = 1} \ rho_ \ tau (y_i-X'_i b_ \ tau) 여기서 \ rho_ \ tau = u_i \ cdot (\ tau-1 (u_i <0)) 은 재가 중 함수입니다 ( "체크"기능이라고 함) 잔차의 u_i .τth

β^QR=minbi=1nρτ(yiXibτ)
ρτ=ui(τ1(ui<0))ui

Firpo 등 의 논문에서 . (2009) 에서 저자들은 조건부 양자 회귀가 흥미로운 효과를 나타내지 않는다고 진술했다. 그들은 조건부 결과를 모집단에 일반화 할 수 없다고 말합니다. 이는 τth 무조건 Quantile yiτth 조건부 Quantile y_i | X_i 와 같지 않을 수 있기 때문 yi|Xi입니다.

올바르게 이해하면 문제의 일부는 X_i에 포함 된 공변량이 Xi순위 변수 u_i 에 영향을 미친다는 것 ui입니다. 왜 이것이 문제를 일으키는 지 이해할 수 없습니다.

내 질문은 다음과 같습니다.

  1. 조건부 및 무조건 Quantile 효과가 서로 다른 점은 무엇입니까?
  2. 조건부 Quantile 회귀 계수를 어떻게 해석 할 수 있습니까?
  3. 조건부 Quantile 회귀 분석이 바이어스 되었습니까?

참고 문헌 :

  • Koenker, R., & Bassett, G. (1978) "Regression Quantiles", Econometrica , Vol. 46 (1), 33-50 쪽.
  • Firpo, S. et al. (2009) "무조건 Quantile 회귀", Econometrica , Vol. 77 (3), 953-973 쪽.

1
Angrist와 Pischke의 "대부분 무해한 계량 경제학"7 장을 확인하는 것이 좋습니다. 여기에는 Quantile 회귀 계수 해석 및 X에 조건부 인 Quantile의 의미에 대한 몇 가지 예가 있습니다. 하나의 공변량의 영향을 분리하려고하지 않는 한 이러한 의미가 모델을 사용하는 경우 무효화되지 않는다는 데 동의합니다. Quantile 회귀 분석 또한 편향 될 수 있다고 생각합니다. Angrist와 Pischke는 예를 들어 생략 된 변수를 제어하기 위해 제안 된 방법을 탐색합니다.
Juan C

1
답은 아니지만 단서 인 Quantile 회귀 분석은 "누락 된 데이터"문제로 캐스트 될 수 있는데, 여기서 누락 된 데이터는 가중 OLS 회귀 분석에 사용되는 가중치입니다. 예를 들어, 역 가중치에 지수 분포를 사용하면 회귀 중앙값 ( )을 얻을 수 있습니다. τ=50
probabilityislogic

답변:


29

세트 업
양식의 단순한 회귀가 있다고 가정 결과가 사람의 로그 실적 어디에 , 학교 교육의 년의 수이며, 인 오류 기간. OLS를 통해 얻을 수있는 소득에 대한 교육의 평균 효과만을 보는 대신 결과 분포의 다른 부분에서 영향을보고자합니다.

lnyi=α+βSi+ϵi
iSiϵi

1) 조건부 설정과 무조건 부 설정의 차이점
먼저 로그 수익을 플로팅하고 와 두 개 선택합니다 . 여기서 는 무조건 부 수입 분배의 하위에 있고 는 상위에 있습니다. ABAB여기에 이미지 설명을 입력하십시오

극히 정상적인 것처럼 보이지는 않지만 시뮬레이션에서 200 개의 관측 값 만 사용했기 때문입니다. 수년간의 교육으로 수입을 조정하면 어떻게됩니까? 각 교육 수준에 대해 "조건부"소득 분배를 얻게됩니다. 즉, 위와 같이 밀도 플롯을 얻을 수 있지만 각 교육 수준에 대해 별도로 나옵니다.

여기에 이미지 설명을 입력하십시오

두 개의 진한 파란색 선은 중앙값 (하위 선)과 90 번째 백분위 수 (상단 선)에서 선형 분위수 회귀 분석으로 얻은 예상 수입입니다. 교육 5 년 및 15 년의 붉은 밀도는 조건부 수입 분포의 추정치를 제공합니다. 보다시피, 개인 는 5 년의 교육을, 개인 는 15 년의 교육을받습니다. 분명히, 개인 는 5 년간의 교육 기간 동안 그의 배들 사이에서 상당히 잘하고 있기 때문에 그녀는 90 번째 백분위 수에 있습니다.ABA

따라서 다른 변수를 조건으로 설정하면 한 사람이 이제 조건부 분포의 상단에있는 반면 그 사람은 무조건 분포의 하단에있을 것입니다-이것은 Quantile 회귀 계수의 해석을 변경하는 것입니다 . 왜?

이미 OLS를 사용하면 반복 된 기대 법칙을 적용하여 에서 했지만 이것은 불행히도 Quantile에 사용할 수없는 기대 연산자의 속성입니다. 따라서 일반적으로 는 임의의 Quantile 입니다. 이를 위해서는 먼저 조건부 Quantile 회귀 분석을 수행 한 다음 조건 변수를 통합하여 OLS에서와 같이 해석 할 수있는 주 변화 효과 (무조건적 효과)를 얻을 수 있습니다. 이 방법의 예는 Powell (2014)에 의해 제공됩니다 .E[yi|Si]=E[yi]Qτ(yi|Si)Qτ(yi)τ

2) 분위수 회귀 계수를 해석하는 방법은 무엇입니까?
이것은 까다로운 부분이며 세계에 대한 모든 지식을 가지고 있다고 주장하지 않으므로 누군가가 이에 대해 더 잘 설명 할 수 있습니다. 보시다시피 조건부 분포를 고려하든 조건부 분포를 고려하든 소득 분배에서 개인의 순위는 매우 다를 수 있습니다.

조건부 Quantile 회귀 분석
치료 전후에 개인이 결과 분포에있을 위치를 알 수 없으므로 분포에 대해 전체적으로 만 진술 할 수 있습니다. 예를 들어, 위의 예에서 은 추가 교육 연도가 조건부 수입 분포의 90 번째 백분위 수에서 수입을 증가 시킨다는 것을 의미하지만 추가 교육 연도를 사람들에게 할당). 이것이 조건부 양자 추정치 또는 조건부 양자 처리 효과가 종종 "흥미로운"것으로 간주되지 않는 이유입니다. 일반적으로 우리는 치료가 분포뿐만 아니라 현재 개인에게 어떤 영향을 미치는지 알고 싶습니다.β90=0.13

무조건 Quantile 회귀의 경우
해석에 사용되는 OLS 계수와 같습니다. 여기서 어려운 점은 해석이 아니라 항상 쉽지 않은 계수를 얻는 방법입니다 (예 : 매우 드문 데이터의 경우 적분이 작동하지 않을 수 있음). Quantile 회귀 계수를 주 변화하는 다른 방법은 최근 영향 함수를 사용한 Firpo (2009) 방법과 같이 이용 가능합니다. 의견에 언급 된 Angrist와 Pischke (2009)의 책은 양자 회귀 계수의 한계 화는 여전히 계량 경제학에서 활발한 연구 분야라고 주장합니다. 변경 사항 변경 모델에 적용한 Melly and Santangelo (2015) ).

3) 조건부 양자 회귀 계수가 바이어스되어 있습니까? 아니요 (올바로 지정된 모델이 있다고 가정), 그들은 단지 당신이 관심이 있거나 관심이 없을 수도있는 다른 것을 측정합니다. 개인보다는 분포에 대한 추정 된 효과는 내가 흥미롭지 않다고 말한 것입니다. 이에 대한 반대의 예를 들자면 : 1 년의 의무 교육을 추가로 도입하고 이것이 인구의 소득 불평등을 줄이는 지 알고 싶어하는 정책 입안자를 생각해보십시오.

상단 2 개의 패널은 가 모든 Quantile에서 일정한 즉, 일정한 Quantile 처리 효과 인 순수한 위치 이동을 보여줍니다. 즉, 이면 추가 연도 교육은 전체 수입 분배에서 수입을 8 % 증가시킵니다.βτβ10=β90=0.8

Quantile 처리 효과가 일정하지 않은 경우 (하단 2 개 패널에서와 같이) 위치 효과 외에 스케일 효과도 있습니다. 이 예에서 소득 분배의 최하위가 상위보다 증가하여 인구의 90-10 차이 (소득 불평등의 표준 척도)가 감소합니다. 여기에 이미지 설명을 입력하십시오

당신은 어느 개인이 그것으로부터 혜택을 받는지 또는 바닥에서 시작한 분배의 어떤 부분에서 시작했는지 알 수 없습니다 (그 질문에 대답하기 위해 무조건 Quantile 회귀 계수가 필요합니다). 어쩌면이 정책은 그들을 아프게하고 다른 사람들에 비해 더 낮은 부분에 놓을 수도 있지만, 목표로 한 해의 의무 교육이 추가 수입이 줄어든다면 소득 스프레드가 줄어들 것입니다. 그러한 접근법의 예는 Brunello et al. (2009) .

내 생성의 원인으로 인한 양자 회귀의 편향에 여전히 관심이 있다면 Angrist et al (2006) 에서 양자 컨텍스트에 대해 생략 된 가변 바이어스 공식을 도출해보십시오.


1
현재이 기술의 R 구현이 있습니까?
챈들러

1

@Andy가 제공하는 탁월한 답변 외에도. 당신은 체크 아웃 할 수 있습니다 :

Borah, BJ, & Basu, A. (2013). "약물 준수를 평가하기위한 응용 프로그램을 통한 조건부 및 무조건 Quantile 회귀 접근법의 차이점을 강조합니다." 건강 경제학, 22 (9), 1052–1070. http://doi.org/10.1002/hec.2927

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.