여러 데이터 세트에서 여러 알고리즘의 성능을 비교하고 있습니다. 이러한 성능 측정이 정규 분포를 보장하지는 않기 때문에 Demšar (2006)를 기반으로 Nemenyi 사후 테스트를 통해 Friedman Test를 선택했습니다 .
그런 다음 후속 Shaffer post-hoc 테스트로 Quade 테스트와 같은 다른 방법을 제안하는 것 외에도 Nemenyi 테스트를 다르게 적용하는 다른 논문을 발견했습니다.
Nemenyi 사후 테스트를 올바르게 적용하려면 어떻게합니까?
1. Studentized range 통계를 사용합니까?
Demšar의 논문에서 평균 순위 차이가 임계 거리 CD보다 크면 귀무 가설 (두 알고리즘의 성능 차이는 없음)을 거부한다고합니다.
"임계 값 qα는 학생 범위 통계를 나눈 값을 기준으로합니다 "
약간의 파기 후에 나는 당신에게 그 "임계 값"이 특정 알파에 대해, 예를 들어 의 테이블에서 , 무한한 자유도 (각 테이블의 맨 아래)에 대해 조회 될 수 있음을 발견했습니다 .
또는 정규 분포를 사용합니까?
내가해야 할 일을 알고 있다고 생각했을 때, 나는 정규 분포 만 사용했기 때문에 나를 혼란스럽게하는 또 다른 논문을 발견했습니다. Demšar는 12 페이지에서 비슷한 내용을 언급하고 있습니다.
이러한 방법을 사용하여 i 번째 및 j 번째 를 비교하기위한 테스트 통계는 z 값은 정규 분포표에서 해당 확률을 찾은 다음 적절한 와 비교하는 데 사용됩니다 . 테스트는 다중 비교를 보상하기 위해 값을 조정하는 방식이 다릅니다 .
이 단락에서 그는 모든 알고리즘을 제어 알고리즘과 비교하는 것에 대해 이야기했지만 "다중 비교를 보상하기 위해 조정하는 방식이 다릅니다"라는 말은 이것이 Nemenyi 테스트에도 적용되어야 함을 시사합니다.
따라서 나에게 논리적으로 보이는 것은 일반적으로 분포 된 검정 통계량 에 따라 p- 값 을 계산하고 로 나눠서 수정하는 것 입니다.
그러나, 귀무 가설을 기각하는 순위 차이가 완전히 다릅니다. 그리고 지금 나는 붙어 있고 어떤 방법을 적용 해야할지 모르겠습니다. 나는 더 간단하고 논리적이기 때문에 정규 분포를 사용하는 것에 강하게 기대하고 있습니다. 또한 테이블에서 값을 찾을 필요가 없으며 특정 유의성 값에 바인딩되어 있지 않습니다.
그런 다음 다시 학생 범위 통계를 사용한 적이 없으며 이해하지 못합니다.