누군가 Mahalanobis 거리의 개념을 설명해 줄 수 있습니까? 예를 들어, 두 점 x와 y 사이의 마할 라 노비스 거리는 무엇이며, 특히 패턴 인식을 위해 어떻게 해석됩니까?
누군가 Mahalanobis 거리의 개념을 설명해 줄 수 있습니까? 예를 들어, 두 점 x와 y 사이의 마할 라 노비스 거리는 무엇이며, 특히 패턴 인식을 위해 어떻게 해석됩니까?
답변:
Mahalanobis 거리는 일련의 데이터에서 특이 치를 찾는 데 사용됩니다. 나는 당신이 어떤 분야에 있는지 모르지만, 심리학에서는 데이터 세트의 규범에 따라 예상되는 것과 "적합하지 않은"사례를 식별하는 데 사용됩니다. 예를 들어, 표본이 우울증 수준이 낮은 개인으로 구성되어 있고 우울증 수준이 매우 높은 한두 명의 개인이있는 경우 예상 임계 값보다 큰 Mahalanobis 거리가 있습니다. 이러한 사례가 매우 극단적이고 데이터 세트에 적합하지 않다고 생각되면 제거 할 수 있습니다. (제공된 예를 사용하여 샘플은 우울증 수준이 낮은 개인으로 구성되므로 우울증 수준이 높은 한두 사람은 나머지와 맞지 않습니다). 많은 통계 분석에는 "정상 가정", 즉 데이터가 정규 분포되어 있다는 기대가 있기 때문에 특이 치를 식별하는 것이 매우 중요합니다. 특이 치는 또한 치우친 데이터에 기여할 수 있으므로 이러한 이유로 제거해야합니다. (전체 변수를 변환하지 않고 비뚤어 짐을 수정하지 않는 한). SPSS와 같은 많은 통계 프로그램을 사용하면 M 거리와 각 점수와 관련된 확률을 계산하여 특이 치를 식별 할 수 있습니다. SPSS 지침을 제공 할 수 있지만 SPSS를 사용 중인지 잘 모르겠습니다. (전체 변수를 변환하지 않고 비뚤어 짐을 수정하지 않는 한). SPSS와 같은 많은 통계 프로그램을 사용하면 M 거리와 각 점수와 관련된 확률을 계산하여 특이 치를 식별 할 수 있습니다. SPSS 지침을 제공 할 수 있지만 SPSS를 사용 중인지 잘 모르겠습니다. (전체 변수를 변환하지 않고 비뚤어 짐을 수정하지 않는 한). SPSS와 같은 많은 통계 프로그램을 사용하면 M 거리와 각 점수와 관련된 확률을 계산하여 특이 치를 식별 할 수 있습니다. SPSS 지침을 제공 할 수 있지만 SPSS를 사용 중인지 잘 모르겠습니다.