두 개의 다변량 데이터 세트가 제공되고 이전과 새 데이터 세트가 있으며 동일한 프로세스 (모델이 없음)로 생성되었지만 아마도 수집 / 생성 라인을 따라 어딘가에 있다고 가정하십시오. 데이터에 문제가 생겼습니다. 예를 들어 기존 데이터에 대한 유효성 검사 세트 또는 기존 데이터에 추가 할 때 새 데이터를 사용하고 싶지 않을 것입니다.
Wilcoxon 순위 합계와 같은 1D 통계 (변수 당)를 수행하고 여러 테스트 수정을 시도 할 수는 있지만 최적인지는 확실하지 않습니다 (다중 테스트 문제는 물론 다변량 데이터의 복잡성을 캡처하는 것). 한 가지 방법은 분류기를 사용하여 두 데이터 세트를 구별 할 수 있는지 확인하는 것입니다 (최적의 최적 분류 기가 제공됨). 그것은 작동하는 것처럼 보이지만 여전히 a) perhp 더 나은 방법이 있기 때문에 perhp b) 그것이 왜 다른지 알려주기 위해 실제로 설계되지 않았습니다 (아무것도 없다면 최고의 예측자를 사용하고 더 나은 것으로 추정되는 다른 좋은 예측 변수를 놓칠 수 있습니다)