Mahalanobis 거리와 레버리지의 관계를 증명 하시겠습니까?


12

Wikipedia 에서 공식을 보았습니다 . Mahalanobis 거리 및 레버리지와 관련이 있습니다.

Mahalanobis 거리는 지렛대 통계량 h 와 밀접한 관련이 있지만, 다른 척도를 갖습니다.

D2=(N1)(h1N).

A의 링크 된 기사 , 위키 백과 설명 h 이 용어를 :

선형 회귀 모델에서는 대한 활용 점수 ith 데이터 유닛은 다음과 같이 정의된다 :

hii=(H)ii,
ith 모자 행렬의 대각 요소 H=X(XX)1X 여기서 ⊤는 행렬 전치이다.

어디서나 증거를 찾을 수 없습니다. 정의에서 시작하려고했지만 진행할 수 없습니다. 누구나 힌트를 줄 수 있습니까?

답변:


11

Mahalanobis 거리에 대한 설명을 아래에서 위로 설명합니다. 두 가지 주요 결과가 포함됩니다.

  1. 정의에 따라 회귀자가 균등하게 이동해도 변경되지 않습니다.

  2. 벡터 xy 사이의 제곱 된 마할 라 노비스 거리는

    D2(x,y)=(xy)Σ1(xy)
    로 주어집니다. 여기서 Σ 는 데이터의 공분산입니다.

(1) 회귀 자의 평균이 모두 0이라고 가정 할 수 있습니다. hi 를 계산해야 합니다. 그러나 주장이 사실이 되려면 가정을 하나 더 추가해야합니다.

모델은 절편을 포함해야합니다.

이를 허용하면 k0 회귀 분석기와 n 데이터가 있고 관측 값 i에 대한 회귀 분석기 j 의 값을 x i j 로 씁니다 . 이들의 열 벡터하자 N의 회귀에 대한 값 j는 기입 X , J 이들의 행 벡터 k 개의 관측 값 i가 쓸 수 x를 I를 . 그런 다음 모델 매트릭스ixijnjx,jkixi

X=(1x11x1k1x21x2k1xn1xnk)

정의에 따르면 모자 매트릭스는

H=X(XX)1X,

대각선을 따라있는 항목 i

(1)hi=hii=(1;xi)(XX)1(1;xi).

중심 행렬을 역으로 계산하는 것 외에는 아무것도 없지만 첫 번째 주요 결과 덕분에 특히 블록 행렬 형식으로 작성할 때 쉽습니다.

XX=n(100C)

0=(0,0,,0)

Cjk=1ni=1nxijxik=n1nCov(xj,xk)=n1nΣjk.

Σ

(XX)1=1n(100C1)=(1n001n1Σ1).

(1)

hi=(1;xi)(1n001n1Σ1)(1;xi)=1n+1n1xiΣ1xi=1n+1n1D2(xi,0).

Di2=D2(xi,0)

Di2=(n1)(hi1n),

QED .

1/nXn1n1n


i


관계가 실제로 유지됨을 보여주는 R 코드 :

x <- mtcars

# Compute Mahalanobis distances
h <- hat(x, intercept = TRUE); names(h) <- rownames(mtcars)
M <- mahalanobis(x, colMeans(x), cov(x))

# Compute D^2 of the question
n <- nrow(x); D2 <- (n-1)*(h - 1/n)

# Compare.
all.equal(M, D2)               # TRUE
print(signif(cbind(M, D2), 3))

훌륭한 답변, 엄격하고 직관력이 매우 우수합니다. 건배!
cgrudz

게시물 @ whuber 감사합니다! 온 전성 검사의 경우 관계가 실제로 유지됨을 나타내는 R 코드가 있습니다. x <-mtcars rownames (x) <-NULL colnames (x) <-NULL n <-nrow (x) h <-hat (x, T) 마할 라 노비스 (x, colMeans (x), cov (x)) (n-1) * (h-1 / n) all.equal (mahalanobis (x, colMeans (x), cov (x)), (n-1 ) * (h-1 / n))
Tal Galili

1
@Tal 나는 위생 검사가 필요하다고 생각하지 않았지만 코드에 감사드립니다. :-) 나는 그것을 명확히하고 그 출력을 약간 수정했습니다.
whuber

1
@ whuber, 나는 평등을 작동시키는 방법을 보여주는 예를 원했습니다 (가정을 올바르게 가지고 있음을 나에게 분명히합니다). 나는 또한 관련 Wiki 항목을 확장했습니다 : en.wikipedia.org/wiki/… (당신이 적합하다고 생각하면 자유롭게 지출하십시오 :))
Tal Galili
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.