사용중인 것 같습니다 R
. 그렇다면 ? identify를 사용하여 산점도에서 점을 식별 할 수 있습니다 . 나는 여기에 몇 가지 일이 있다고 생각합니다. 먼저, LN_RT_vol_in ~ LN_AT_vol_in
(강조 표시된 부분) 의 줄거리 에서 약 (.2, 1.5) 에 매우 영향력있는 지점이 있습니다. 이것은 약 -3.7 인 표준화 된 잔차 일 가능성이 높습니다. 이 점의 효과는 회귀선을 평평하게하여 다른 방법으로는 얻었을 때보 다 위쪽으로 기울어지게하는 것입니다. 그 효과는 모든 잔차가 줄거리 내에서 위치 했을 때를 기준 으로 시계 반대 방향으로 회전 한다는 것입니다 residual ~ predicted
(적어도 공변량으로 생각하고 다른 것을 무시할 때).
그럼에도 불구하고, 명백한 잔차 직선은 원래 데이터의 3 차원 구름 어딘가에 존재하기 때문에 여전히 존재합니다. 한계점에서 찾기가 어려울 수 있습니다. 식별 () 함수를 사용하면 도움이되고 rgl 패키지를 사용하여 마우스로 자유롭게 회전 할 수있는 동적 3D 산점도를 만들 수도 있습니다. 그러나 직선 잔차는 예측 값에서 모두 0 미만이고 잔차가 0보다 낮습니다 (즉, 적합 회귀선 아래). 어디를 볼지에 대한 큰 힌트를줍니다. 당신의 음모를 다시 보면서LN_RT_vol_in ~ LN_AT_vol_in
나는 그들을 볼 수 있다고 생각합니다. 해당 영역에있는 점 구름의 아래쪽 가장자리에서 약 (-.01, -1.00)에서 대각선으로 아래로 왼쪽으로 뻗어있는 점들이 상당히 똑 바르습니다. 나는 이것이 그 점이 의심 스럽다고 생각한다.
다시 말해서, 잔차는 이미 데이터 공간 내 어딘가에 있기 때문에 그렇게 보입니다. 본질적으로 이것은 @ttnphns가 제안하는 것입니다. 그러나 원래 치수에서 일정하다고 생각하지 않습니다. 원래 축과 각도가 일정한 치수라고 생각합니다. 또한 @MichaelChernick에 동의합니다. 잔류 그림 에서이 명백한 직진은 무해하지만 데이터가 실제로는 정상적이지 않다는 데 동의합니다. 그러나 다소 평범한 데이터이므로 적절한 수의 데이터가있는 것처럼 보이므로 CLT가 당신을 덮을 수 있지만 경우에 대비하여 부트 스트랩을 원할 수 있습니다. 마지막으로, 'outlier'가 결과를 주도하고 있다고 걱정합니다. 강력한 접근 방식은 아마 만했다된다.