선형 회귀가 Pearson의 상관 관계와 관련이있는 경우 Kendall과 Spearman의 상관 관계와 관련된 회귀 기술이 있습니까?


27

어쩌면이 질문은 순진하지만,

선형 회귀가 Pearson의 상관 계수와 밀접한 관련이있는 경우 Kendall 및 Spearman의 상관 계수와 밀접한 관련이있는 회귀 기술이 있습니까?


3
하나의 설명과 종속 변수가있는 간단한 예 : 와 의 순위 에 대한 선형 회귀는 회귀 계수로 Spearman의 상관 계수를 산출합니다. 이 경우 회귀 분석에서 와 는 서로 바꿔 사용할 수 있습니다. y x yxyxy
COOLSerdash

2
몇 가지 생각. Kendall의 및 Spearman의 는 순위에 따른 상관 계수입니다. 와 사이의 추구 관계 는 그런 다음 순위를 포함해야합니다. 그러나 순위를 계산하면 관측치 간의 종속성이 발생하고, 이로 인해 오차 항 간의 종속성이 발생하여 선형 회귀가 제거됩니다. 그러나 다른 설정에서 copulas를 사용하여 와 사이의 종속 구조를 모델링하면 copula의 선택에 따라 Kendall의 및 / 또는 Spearman의 와 연결될 수 있습니다. ρ x y x y τ ρτρxyxyτρ
QuantIbex

1
@QuantIbex는 그 의존성이 반드시 암시 하는가? E[εiεj]0
shadowtalker

답변:


21

선형 회귀에 맞추기 위해 거의 모든 상관 측정을 사용하고 Pearson 상관을 사용할 때 최소 제곱을 재현하는 매우 간단한 방법이 있습니다.

관계의 기울기가 인 경우 와 사이의 상관 관계는 이어야합니다 .y - β xβyβx0x0

그것은 아무것도 인 경우에 실제로, 다른 것보다 상관 조치 따기 될 것입니다 - 일부 캡처되지 선형 관계가있을 것입니다.0

따라서 우리는, 경사를 찾아 기울기를 추정 할 수 차종 샘플 사이의 상관 관계를 와 수 . 많은 경우 (예 : 순위 기반 측정을 사용할 때) 상관 관계는 기울기 추정값의 단계 함수이므로 0이되는 구간이있을 수 있습니다. 이 경우 일반적으로 표본 추정값이 구간의 중심이되도록 정의합니다. 종종 단계 함수는 어떤 지점에서 0 이상에서 0 아래로 이동하며,이 경우 추정값은 점프 지점에 있습니다. Y- ~ ββ~X 0yβ~xx0

이 정의는 예를 들어 모든 방식의 순위 기반 및 강력한 상관 관계에서 작동합니다. 또한 (상당한 상관 관계와 중요하지 않은 상관 관계 사이의 경계를 표시하는 기울기를 찾아서) 일반적인 방법으로 기울기 간격을 얻는 데 사용할 수 있습니다.

이것은 물론 경사 만 정의합니다. 기울기가 추정되면, 절편은 잔차 에 대해 계산 된 적절한 위치 추정을 기반으로 할 수 있습니다 . 순위 기반 상관의 경우 중앙값이 일반적인 선택이지만 다른 적절한 선택이 많이 있습니다.yβ~x

다음 car은 R 의 데이터 에 대한 기울기에 대한 상관 관계입니다 .

여기에 이미지 설명을 입력하십시오

Pearson 상관 관계는 최소 제곱 경사에서 0을 교차하고, 3.932
Kendall 상관 관계는 Theil-Sen 경사에서
0을 교차하고 , 3.667 Spearman 상관 관계는 0을 교차하여 3.714 의 "Spearman-line"기울기를 제공합니다.

이 예는 세 가지 기울기 추정치입니다. 이제 요격이 필요합니다. 간단하게하기 위해 첫 번째 절편의 평균 잔차와 다른 두 절의 중간 값을 사용합니다 (이 경우에는 중요하지 않음).

           intercept
 Pearson:  -17.573 *     
 Kendall:  -15.667
 Spearman: -16.285

* (최소 제곱과의 작은 차이는 기울기 추정치의 반올림 오차로 인한 것입니다. 다른 추정치에서도 유사한 반올림 오차가 있음)

해당 피팅 라인 (위와 동일한 색 구성표 사용)은 다음과 같습니다.

여기에 이미지 설명을 입력하십시오

편집 : 사분면 상관 기울기는 3.333입니다.

Kendall 상관 관계와 Spearman 상관 관계 기울기는 최소 제곱보다 영향력있는 특이 치에 대해 훨씬 더 강력합니다. Kendall의 경우 극적인 예를 보려면 여기 를 참조 하십시오 .


(+1) 대단한 설명! 이 상황에서 Kendall이 Spearman보다 더 선호되는 이유가 있습니까?
amoeba는 Reinstate Monica

4
이것이 사실 인 이유는 여러 가지가 있습니다. 첫 번째는 Theil-Sen 라인이 간단하게 설명 된 추정기 (쌍별 경사의 중앙값)를 가지고 있다는 것입니다. 작은 샘플에서는 손 계산에 매우 적합합니다. Kendall 상관 관계 는 정규성에 더 빨리 접근하고 수학적으로 다루기 쉽습니다 . 여기여기도 참조 하십시오 .
Glen_b-복지 주 모니카

20

비례 배당률 (PO) 모델은 Wilcoxon 및 Kruskal-Wallis 검정을 일반화합니다. 가 이진일 때의 Spearman의 상관 관계 는 Wilcoxon 검정 통계량으로 간단히 변환됩니다. 따라서 PO 모델이 통합 방법이라고 말할 수 있습니다. PO 모델은 고유 한 값 (1 개 미만) 만큼 많은 절편을 가질 수 있으므로 순서 와 연속 모두를 처리합니다 .Y YXYY

PO 모델에서 점수 통계량 의 분자 는 정확히 Wilcoxon 통계량입니다.χ2

PO 모델은 프로 빗, 비례 위험 및 보완 로그-로그 모델을 포함하여보다 일반적인 누적 확률 (일부 호출 누적 링크) 모델의 특별한 경우입니다. 사례 연구는 나의 유인물 15 장을 참조하십시오 .


4

Aaron Han (1987 년 계량 경제학)은 tau를 최대화하여 회귀 모형에 맞는 Maximum Rank Correlation Estimator를 제안했습니다. Dougherty and Thomas (2012 년 심리학 문헌)는 ​​매우 유사한 알고리즘을 제안했습니다. MRC에는 그 속성을 보여주는 많은 작업이 있습니다.

Aaron K. Han, 일반화 된 회귀 모형의 비모수 분석 : 최대 순위 상관 추정기, 계량 경제학 저널, 제 35 권, 1987 년 7 월 2 ~ 3 호, 페이지 303-316, ISSN 0304-4076, http : // dx.doi.org/10.1016/0304-4076(87)90030-3 . ( http://www.sciencedirect.com/science/article/pii/0304407687900303 )

Dougherty, MR, RP (2012). 비선형 세계에서 강력한 의사 결정. 심리적 검토, 119 (2), 321. http://damlab.umd.edu/pdf%20articles/DoughertyThomas2012Rev.pdf 에서 검색 됨 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.