7, 16 및 29 지점이 영향력있는 지점인지 여부를 해결하는 방법을 아는 사람이 있습니까? 나는 Cook의 거리가 1보다 작기 때문에 그렇지 않다는 것을 읽었습니다. 맞아?
7, 16 및 29 지점이 영향력있는 지점인지 여부를 해결하는 방법을 아는 사람이 있습니까? 나는 Cook의 거리가 1보다 작기 때문에 그렇지 않다는 것을 읽었습니다. 맞아?
답변:
일부 텍스트는 Cook의 거리가 1보다 높은 지점이 영향력있는 것으로 간주된다고 알려줍니다. 다른 텍스트는 또는 4 / ( N − k - 1 ) 의 임계 값을 제공합니다. 여기서 N 은 관측치 수이고 k 는 설명 변수의 수입니다. 귀하의 경우 후자의 수식은 0.1 주위의 임계 값을 산출해야합니다.
회귀 진단에 관한 그의 소책자에서 John Fox (1)는 수치 임계 값을 줄 때 다소 신중합니다. 그는 그래픽 사용을 권고하고 "나머지보다 실질적으로 더 큰 D의 값"을 갖는 점을 자세히 조사 할 것을 권고합니다. Fox에 따르면 그래픽 디스플레이를 향상시키기 위해 임계 값을 사용해야합니다.
귀하의 경우 관측치 7과 16은 영향력있는 것으로 간주 될 수 있습니다. 글쎄, 나는 적어도 그들을 자세히 살펴볼 것입니다. 관측치 (29)는 다른 두 개의 관측치와 실질적으로 다르지 않다.
(1) 폭스, 존 (1991). 회귀 진단 : 소개 . 세이지 출판물.
여기에 또 하나의 가치가 있습니다. 관측 연구에서 예측 변수 공간에서 균일하게 샘플링하기가 어려운 경우가 많으며 주어진 영역에 몇 가지 점이있을 수 있습니다. 이러한 점은 나머지 부분과 다를 수 있습니다. 몇 가지 뚜렷한 사례가있는 경우 불만이있을 수 있지만 특이 치를 강등하기 전에 상당한 생각이 필요합니다. 예측 변수간에 합법적으로 상호 작용이 있거나 예측 변수 값이 극단이되면 시스템이 다르게 동작하도록 전환 될 수 있습니다. 또한 공선 예측 변수의 효과를 풀 수 있습니다. 영향력있는 점은 변장에서 축복이 될 수 있습니다.