다양한 출처 (예 : 여기 참조 )에서 중간에 대한 신뢰 구간에 대해 다음 공식이 제공됩니다 (특히 상자 및 수염 도표에 노치를 그리기 위해).
마법 상수 은 나를 미치게합니다. 어떻게 얻었는지 알 수 없습니다. 다양한 근사치 (예를 들어 분포가 가우시안이고 N 이 크다고 가정 )에 단서가 없습니다. 상수에 대해 다른 값을 얻습니다.
다양한 출처 (예 : 여기 참조 )에서 중간에 대한 신뢰 구간에 대해 다음 공식이 제공됩니다 (특히 상자 및 수염 도표에 노치를 그리기 위해).
마법 상수 은 나를 미치게합니다. 어떻게 얻었는지 알 수 없습니다. 다양한 근사치 (예를 들어 분포가 가우시안이고 N 이 크다고 가정 )에 단서가 없습니다. 상수에 대해 다른 값을 얻습니다.
답변:
쉽습니다. 노치 된 상자와 수염 그림이 소개 된 원본 논문을 확인하면 ( Robert McGill, John W. Tukey 및 Wayne A. Larsen. 상자 그림의 변형, The American Statistician, Vol.32, No. 1 (2 월) 1978), pp. 12-16 ; 다행히도 JSTOR에 있습니다. ), 우리는이 공식이 다음과 같은 방식으로 정당화되는 7 절을 찾았습니다.
각 중앙값에 대해 95 % 신뢰 구간을 나타내는 노치를 원한다면 C = 1.96이 사용됩니다. [여기에서 C는 우리와 관련된 상수가 다르지만 정확한 관계는 나중에 명백 할 것이므로 중요하지 않습니다 — IS] 그러나 95 % 수준에서 유의미한 차이를 나타내는 "갭 게이지"의 형태가 요구 되었기 때문에 , 이것은 완료되지 않았습니다. C = 1.96은 두 그룹의 표준 편차가 크게 다른 경우에만 적절하다는 것을 알 수 있습니다. 이 값이 거의 같으면 C = 1.386이 적절한 값이되고 1.96으로 테스트가 너무 엄격 해집니다 (99 % 이상). 이들 한계, C = 1.7 사이의 값이 실험적으로 바람직하게 선택되었다. 따라서 사용 된 노치는 다음과 같이 계산되었습니다.
짧은 대답은 CI 중앙값의 일반적인 공식이 아니라 시각화를위한 특정 도구이며 특정 목표를 달성하기 위해 상수를 실험적으로 선택했다는 것입니다.
마법이 없습니다.
죄송합니다.