답변:
몇 가지가 있습니다. 이 링크에서 중단되지 않은 버전의 용지에 대한 철저한 비교를 볼 수 있습니다 (이 답변의 맨 아래에 적절한 참조).
문제의 제약으로 인해 가장 강력한 알고리즘 (L / RMC)의 분석은 최대 12.5 %입니다. L / RMC의 장점은 Quantile을 기반으로하며 기본 분포에 모멘트가없는 경우에도 해석 가능하다는 것입니다. 또 다른 장점은 테일 가중치를 측정하기 위해 데이터의 오염되지 않은 부분 분포의 대칭을 가정하지 않는다는 것입니다. 실제로 알고리즘은 오른쪽 테일 가중치에 대한 RMC와 왼쪽 테일 가중치에 대한 LMC의 두 숫자를 반환합니다.
구성에 의해 : 예를 들어, 오염의 양은 알고리즘이 -1을 반환하게 할 수 없습니다!). 실제로, 오염 된 샘플에서 얻은 값에서 가장 큰 영향을받는 추정값 (항상 2 개가 있음)을 유발하지 않으면 서 샘플의 약 5 %를 매우 병리학적인 특이 값으로 대체 할 수 있습니다.
L / RMC도 널리 구현됩니다. 예를 들어 여기 에서 R 구현을 찾을 수 있습니다 . 위에 링크 된 기사에서 설명한대로 L / RMC를 계산하려면 데이터의 왼쪽과 오른쪽 절반에서 MC (링크에서 구현 된 견적 도구)를 별도로 계산해야합니다. 여기에서 (왼쪽) 오른쪽 절반은 원래 샘플의 중앙값보다 큰 관측치 (작은)로 구성된 하위 샘플입니다.