오염 된 가우시안 분포에서 가져온 데이터와 관련된 예에서 대신 를 사용하여 대량의 데이터를 설명하는 모수를 더 잘 추정 할 수 있습니다.여기서 는 다음과 같습니다.메드 | x − med ( x ) | 미친 ( x )madmed|x−med(x)|mad(x)
mad=1.4826×med|x−med(x)|
여기서 , 은 x 가 오염되지
않았을 때 E ( mad ( x ) 2 ) = Var ( x ) 가 원래 가우스 (Walker)에 의해 만들어 지도록하기위한 일관성 요인입니다. , H. (1931)).(Φ−1(0.75))−1=1.4826
E(mad(x)2)=Var(x)
x
이 경우 샘플 평균 대신 를 사용하지 않는 이유를 생각할 수 없습니다 . (가우스에서!) 낮은 효율의 화가는 사용하지 않는 이유가 될 수 화를 귀하의 예에. 그러나 mad에 대해 동일하고 강력하며 효율적인 대안이 있습니다. 그들 중 하나는 Q n입니다medmadmadmadQn. 이 추정기는 옆에 많은 다른 장점이 있습니다. 또한 특이 치에 대해 매우 둔감합니다 (사실 미치광이만큼 무감각합니다). 미친 것과는 달리, 그것은 위치 추정을 중심으로 구축되지 않았으며 데이터의 오염되지 않은 부분의 분포가 대칭 적이라고 가정하지 않습니다. 미친 것과 마찬가지로 주문 통계를 기반으로하므로 샘플의 기본 분포에 모멘트가없는 경우에도 항상 잘 정의됩니다. 미친 것처럼, 그것은 명백한 형태를 가지고 있습니다. 더욱 미친보다, 나는 아무 이유가 대신 표본 표준 편차를 사용하지 않는 방법을 참조하십시오 은합니다 (에 대한 자세한 정보를 원하시면 Rousseeuw 및 Croux 1993 참조 설명의 예에서 Q의 N ).QnQn
마지막 질문에 대해서는 인 특정 경우에 대해x∼Γ(ν,λ)
med(x)≈λ(ν−1/3)
과
mad(x)≈λν−−√
(두 경우 모두 때 근사값이 좋아짐 ) ν> 1.5
ν^=(med(x)mad(x))2
과
λ^=mad(x)2med(x)
완전한 파생에 대해서는 Chen and Rubin (1986)을 참조하십시오.
- J. Chen and H. Rubin, 1986 년. 감마와 포아송 분포의 중앙값과 평균의 차이에 대한 경계 프로 밥. Lett., 4, 281–283.
- PJ Rousseeuw and C. Croux, 1993. 미국 통계 협회의 중간 절대 편차 일지 대안, Vol. 88, No. 424, 1273-1283 쪽
- 워커, H. (1931). 통계 방법의 역사에 관한 연구. 볼티모어, 메릴랜드 : Williams & Wilkins Co. pp. 24–25.