Mahalanobis 거리는 무엇이며 패턴 인식에 어떻게 사용됩니까?


11

누군가 Mahalanobis 거리의 개념을 설명해 줄 수 있습니까? 예를 들어, 두 점 x와 y 사이의 마할 라 노비스 거리는 무엇이며, 특히 패턴 인식을 위해 어떻게 해석됩니까?


3
지금 무엇에 대해 이해하고 있습니까? Wikipedia
gung-Monica Monica 복원

2
매우 밀접하게 관련 : stats.stackexchange.com/questions/62092/...를 .
whuber

이 링크를 사용할 수 있습니다. 그것은 잘 decribe people.revoledu.com/kardi/tutorial/Similarity/...
Zohreh

답변:


13

Mahalanobis 거리는 일부 조건 세트가 알려진 조건 세트와 얼마나 유사한 지 측정하는 방법을 제공합니다. 변수 간의 공분산을 설명합니다.

2=(엑스미디엄)1(엑스미디엄)
2=마할 라 노비스 거리엑스=데이터 벡터미디엄=독립 변수의 평균값으로 구성된 벡터1=독립 변수의 역 공분산 행렬=벡터가 바뀌어야 함을 나타냅니다.

페이지 는 자세한 설명 (가로 분석의 예)을 제공합니다.


1
감사, 소스는 나에게 시작에 대한 좋은 설명을 주었다
ayariga

5

Mahalanobis 거리는 일련의 데이터에서 특이 치를 찾는 데 사용됩니다. 나는 당신이 어떤 분야에 있는지 모르지만, 심리학에서는 데이터 세트의 규범에 따라 예상되는 것과 "적합하지 않은"사례를 식별하는 데 사용됩니다. 예를 들어, 표본이 우울증 수준이 낮은 개인으로 구성되어 있고 우울증 수준이 매우 높은 한두 명의 개인이있는 경우 예상 임계 값보다 큰 Mahalanobis 거리가 있습니다. 이러한 사례가 매우 극단적이고 데이터 세트에 적합하지 않다고 생각되면 제거 할 수 있습니다. (제공된 예를 사용하여 샘플은 우울증 수준이 낮은 개인으로 구성되므로 우울증 수준이 높은 한두 사람은 나머지와 맞지 않습니다). 많은 통계 분석에는 "정상 가정", 즉 데이터가 정규 분포되어 있다는 기대가 있기 때문에 특이 치를 식별하는 것이 매우 중요합니다. 특이 치는 또한 치우친 데이터에 기여할 수 있으므로 이러한 이유로 제거해야합니다. (전체 변수를 변환하지 않고 비뚤어 짐을 수정하지 않는 한). SPSS와 같은 많은 통계 프로그램을 사용하면 M 거리와 각 점수와 관련된 확률을 계산하여 특이 치를 식별 할 수 있습니다. SPSS 지침을 제공 할 수 있지만 SPSS를 사용 중인지 잘 모르겠습니다. (전체 변수를 변환하지 않고 비뚤어 짐을 수정하지 않는 한). SPSS와 같은 많은 통계 프로그램을 사용하면 M 거리와 각 점수와 관련된 확률을 계산하여 특이 치를 식별 할 수 있습니다. SPSS 지침을 제공 할 수 있지만 SPSS를 사용 중인지 잘 모르겠습니다. (전체 변수를 변환하지 않고 비뚤어 짐을 수정하지 않는 한). SPSS와 같은 많은 통계 프로그램을 사용하면 M 거리와 각 점수와 관련된 확률을 계산하여 특이 치를 식별 할 수 있습니다. SPSS 지침을 제공 할 수 있지만 SPSS를 사용 중인지 잘 모르겠습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.