특정 다중 공선 성 척도를 선호하는 이유가 있습니까?


22

많은 입력 변수로 작업 할 때 종종 다중 공선 성이 중요 합니다. 다중 공선 성을 감지, 생각 및 / 또는 전달하는 데 사용되는 다중 공선 성 측정에는 여러 가지가 있습니다. 몇 가지 일반적인 권장 사항은 다음과 같습니다.

  1. 특정 변수에 대한 다중아르 자형j2
  2. 특정 변수에 대한 공차1아르 자형j2
  3. 특정 변수에 대한 분산 인플레이션 계수VIF=1공차
  4. 디자인 매트릭스의 조건 번호 전체 :

    최대 (고유 값 (X'X))최소 (고유 값 (X'X))

(위키 백과 기사와 R의 맥락 에서 SO 에 대해 논의 된 다른 옵션이 있습니다 .)

처음 세 개가 서로의 완벽한 기능이라는 사실은 그들 사이의 유일한 순 이점이 심리적 일 것이라고 제안합니다. 반면에 처음 세 개를 사용하면 변수를 개별적으로 검사 할 수 있으므로 이점이 있지만 조건 번호 방법이 가장 적합하다고 들었습니다.

  • 이것이 사실입니까? 무엇에 가장 적합합니까?
  • 조건 번호가 R ^ 2_j 의 완벽한 함수 아르 자형j2입니까? (그렇다고 생각합니다.)
  • 사람들은 그들 중 하나가 설명하기 가장 쉽다는 것을 알고 있습니까? (나는 클래스 외부 에서이 숫자를 설명하려고 시도하지 않았으며, 단지 다중 공선성에 대한 느슨한 질적 설명을 제공합니다.)

: 그에 이미 여기에 무엇을 보충하는 답변으로 질문까지 관련 후속을 게시 한 stats.stackexchange.com/questions/173665/...
키레 니아

답변:


15

1990 년대 후반에 저는 공선성에 대한 논문을 작성했습니다.

내 결론은 조건 지수가 가장 좋다는 것이었다.

주된 이유는 개별 변수를 보지 않고 변수 세트 를 볼 수 있기 때문 입니다. 공선 성은 변수 집합의 함수이므로 좋은 것입니다.

또한 내 몬테카를로 연구 결과는 문제가있는 공선성에 대해 더 나은 민감성을 보여 주었지만, 오래 전에 세부 사항을 잊어 버렸습니다.

반면에 설명하기가 가장 어려울 것입니다. 많은 사람들이 가 무엇인지 알고 있습니다. 이 사람들 중 일부만이 고유 값에 대해 들었습니다. 그러나 진단 도구로 조건 색인을 사용한 경우 설명을 요구 한 적이 없습니다.아르 자형2

이에 대한 자세한 내용은 David Belsley의 책을 확인하십시오. 또는 정말로 원한다면 다중 회귀 분석에 대한 논문 다중 공선 성 진단을 얻을 수 있습니다 . Monte Carlo 연구


1
VIF를 살펴보면 다중 공선 성이 문제가 아니라고 잘못 결론을 내릴 수 있지만 조건 번호를 살펴보면 올바른 결론을 내릴 가능성이 더 높았습니까? 아마도 더 큰 통계적 힘을 가진 테스트와 같은 것입니까?
gung-복직 모니카

4
+1. 다행스럽게도 조건 번호를 설명하기 위해이 사이트 에는 이미 뛰어난 스레드 가 있습니다. 포인트 변수로서 디자인 변수의 2 차 설명에서 볼 수있는 최대 왜곡입니다. 왜곡이 클수록 점이 부분 공간 내에 더 많은 경향이 있습니다. 이 기하학적 통찰력은 또한 중심 디자인 매트릭스의 컨디셔닝이 원시 디자인 매트릭스 자체의 컨디셔닝보다 나은 이유를 보여줍니다.
whuber

1
"올바른"결론이 무엇인지 정확히 정의하기는 어렵습니다. 그러나 출력에서 ​​큰 변화를 일으키는 데이터의 작은 변화와 관련이 있어야합니다. 내가 기억 하듯이 조건 인덱스는 이것과 더 직접적으로 관련되어 있습니다. 그러나 가장 큰 것은 분산 비율을 얻는 것인데, 변수 세트와 그 공선 성의 정도를 볼 수 있습니다. (물론, 14 년 전만해도 .... 나는 상황이 변했다고 생각하지 않습니다. 측정 값은 동일합니다. 그러나 나의 기억은 완벽하지 않을 수 있습니다).
Peter Flom-Monica Monica 복원

3
Gung, 여기서 중요한 점은 조건 번호가 좌표와 독립적이라는 것입니다. 데이터의 (직교) 선형 재조합에서 변경되지 않습니다. 따라서 개별 변수에 대해서는 아무 것도 표현할 수 없지만 전체 컬렉션의 속성을 캡처해야합니다. 이를 사용하면 변수가 표현되는 방식으로 인해 잘못 인도되는 것을 부분적으로 차단할 수 있습니다.
whuber

1
논문을 완성하기에는 너무 늪에 빠졌지 만 지금까지 정말 도움이되었습니다. 다시 감사합니다.
gung-복직 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.