답변:
Mahalanobis 거리에 대한 설명을 아래에서 위로 설명합니다. 두 가지 주요 결과가 포함됩니다.
정의에 따라 회귀자가 균등하게 이동해도 변경되지 않습니다.
벡터 와 사이의 제곱 된 마할 라 노비스 거리는
(1) 회귀 자의 평균이 모두 0이라고 가정 할 수 있습니다. 를 계산해야 합니다. 그러나 주장이 사실이 되려면 가정을 하나 더 추가해야합니다.
모델은 절편을 포함해야합니다.
이를 허용하면 회귀 분석기와 데이터가 있고 관측 값 i에 대한 회귀 분석기 의 값을 x i j 로 씁니다 . 이들의 열 벡터하자 N의 회귀에 대한 값 j는 기입 X , J 이들의 행 벡터 k 개의 관측 값 i가 쓸 수 x를 I를 . 그런 다음 모델 매트릭스 는
정의에 따르면 모자 매트릭스는
대각선을 따라있는 항목 는
중심 행렬을 역으로 계산하는 것 외에는 아무것도 없지만 첫 번째 주요 결과 덕분에 특히 블록 행렬 형식으로 작성할 때 쉽습니다.
QED .
관계가 실제로 유지됨을 보여주는 R 코드 :
x <- mtcars
# Compute Mahalanobis distances
h <- hat(x, intercept = TRUE); names(h) <- rownames(mtcars)
M <- mahalanobis(x, colMeans(x), cov(x))
# Compute D^2 of the question
n <- nrow(x); D2 <- (n-1)*(h - 1/n)
# Compare.
all.equal(M, D2) # TRUE
print(signif(cbind(M, D2), 3))