조건부 평균 관계를 절대적으로 이해해야하는 고유 한 상황 외에도 연구원이 Quantile Regression보다 OLS를 선택해야하는 상황은 무엇입니까?
나는 중간 회귀를 OLS 대체물로 사용할 수 있기 때문에 "꼬리 관계를 이해하는 데 쓸모가 없다면"이라는 대답을 원하지 않습니다.
조건부 평균 관계를 절대적으로 이해해야하는 고유 한 상황 외에도 연구원이 Quantile Regression보다 OLS를 선택해야하는 상황은 무엇입니까?
나는 중간 회귀를 OLS 대체물로 사용할 수 있기 때문에 "꼬리 관계를 이해하는 데 쓸모가 없다면"이라는 대답을 원하지 않습니다.
답변:
평균에 관심이있는 경우 OLS를 사용하고 중앙값에있는 경우 Quantile을 사용하십시오.
한 가지 큰 차이점은 평균이 특이 치 및 기타 극단적 인 데이터의 영향을 더 많이 받는다는 것입니다. 때때로, 그것은 당신이 원하는 것입니다. 한 가지 예는 종속 변수가 이웃의 사회적 자본 인 경우입니다. 많은 사회적 자본을 가진 한 사람의 존재는 전체 이웃에게 매우 중요 할 수 있습니다.
질문의 전제에 혼란이있는 것 같습니다. 두 번째 단락에서는 "중앙 회귀를 OLS 대체물로 사용할 수 있습니다"라고 말합니다. X에서 조건부 중앙값을 회귀하는 것은 (양식의) Quantile 회귀입니다.
기본 데이터 생성 프로세스의 오류가 정규 분포 (잔차가 정상인지 여부를 확인하여 평가할 수있는 경우) 인 경우 조건부 평균은 조건부 중앙값과 같습니다. 또한, 관심있는 임의의 Quantile (예 : 95 번째 백분위 수 또는 37 번째 백분위 수)은 표준 OLS 방법으로 X 차원의 주어진 지점에 대해 결정될 수 있습니다. Quantile 회귀의 주요 매력은 OLS보다 강력하다는 것입니다. 단점은 모든 가정이 충족되면 효율성이 떨어질 것입니다. 즉, 동일한 검정력을 달성하려면 더 큰 표본 크기가 필요합니다.
Peter Flom은 훌륭하고 간결한 대답을했습니다. 질문의 가장 중요한 부분은 "나쁘다"를 정의하는 방법입니다.
더 나쁘게 정의하려면 몇 가지 메트릭스와 피팅을 손실 함수라고하는 것이 얼마나 좋은지 계산하는 함수가 필요합니다.
우리는 손실 함수에 대해 다른 정의를 가질 수 있으며, 각 정의에 옳고 그름은 없지만, 다른 정의는 다른 요구를 충족시킵니다. 잘 알려진 두 가지 손실 함수는 제곱 손실과 절대 값 손실입니다.
성공의 척도로 제곱 손실을 사용하는 경우 Quantile 회귀는 OLS보다 나쁩니다. 반면에 절대 값 손실을 사용하면 Quantile 회귀가 더 좋습니다.
Peter Folm의 답변은 다음과 같습니다.
평균에 관심이있는 경우 OLS를 사용하고 중앙값에있는 경우 Quantile을 사용하십시오.
평균을 추정하려면 Quantile Regression에서 얻을 수 없습니다.
평균을 추정하고 최소 가정 (양자 회귀보다 더 많은 가정)으로 Quantile을 계산하려고하지만 효율성이 더 높은 경우 반모 수 순서 회귀를 사용하십시오. 또한 초과 확률을 제공합니다. 자세한 사례 연구는 내 RMS 과정 노트에 있으며, 한 데이터 세트에서 여러 매개 변수 (사 분위수 및 평균)에 대한 평균 평균 절대 추정 오차가 순서 회귀에 의해 달성된다는 것을 보여줍니다. 그러나 평균을 추정하기 위해서는 OLS가 최고이고, 양자를 추정하기 위해서는 양자 회귀가 가장 좋습니다.