적합도 테스트 : Anderson–Darling test 및 Cramér-von Mises 기준에 대한 질문


10

Anderson-Darling 테스트Cramér-von Mises 기준에 도달했을 때 적합성 테스트가 좋은지 웹 페이지를 읽고 있습니다.

지금까지 나는 요점을 얻었다. Anderson-Darling 테스트와 Cramér-von Mises 기준은 다른 가중치 함수 기반으로 유사한 것으로 보입니다 . 또한 Watson test 라는 Cramér-von Mises 기준의 변형이 있습니다.w

기본적으로 여기에 두 가지 질문이 있습니다

  1. 이 두 가지 방법에 대한 Google 결과는 많지 않습니다. 그들은 여전히 ​​최신 기술입니까? 아니면 이미 더 나은 접근법으로 대체 되었습니까?

    Shapiro–Wilk, Kolmogorov-Smirnov, Lilliefors 및 Anderson-Darling 테스트의 전력 비교 에 대한이 논문에 따르면 AD가 상당히 잘 수행되고 있습니다. Lilliefors와 KS보다 항상 우수하며, 정규 분포를 위해 특별히 설계된 SW 테스트와 매우 가깝습니다.

  2. 그러한 테스트에 대한 신뢰 구간은 얼마입니까?

    AD, CM 및 Watson 테스트의 경우 Wiki 페이지에 테스트 통계 변수가 정의되어 있지만 신뢰 구간을 찾지 못했습니다.

    KS 테스트에는 상황이 더 간단 합니다. 위키 페이지 에서 신뢰 구간은 로 정의되며 의 누적 분포 함수에서 정의됩니다 .KαK

답변:


4

적합도를위한 최첨단 단일 기술은있을 수 없습니다 (예 : 일반적인 대안에 대한 UMP 테스트는 존재하지 않으며 실제로는 아무 것도 근접하지 않습니다. 일부 경우 옴니버스 테스트에서도 끔찍한 힘을가집니다).

일반적으로 검정 통계량을 선택할 때는 해당 작업에 적합한 검정 통계량을 감지하고 사용하는 것이 가장 중요한 편차 종류를 선택하십시오. 일부 테스트는 다양하고 흥미로운 대안으로 잘 수행되며 기본 선택은 괜찮지 만 "최첨단"이 아닙니다.

앤더슨 달링은 여전히 ​​매우 인기가 있으며 합당한 이유가 있습니다. Cramer-von Mises 테스트는 요즘 훨씬 덜 사용됩니다 (놀랍게도 Kolmogorov-Smirnov보다 낫지 만 Anderson-Darling보다 단순하기 때문에 종종 "중간"의 차이에 비해 더 나은 힘을 갖습니다. 분포)

이러한 모든 테스트는 어떤 종류의 대안에 대한 편견으로 인해 어려움을 겪고 있으며 Anderson-Darling이 다른 테스트보다 훨씬 더 나쁜 경우를 쉽게 찾을 수 있습니다. (제언하는 바와 같이, 모두를 지배하는 하나의 시험보다 '코스 말'이 더 많습니다). 불행히도이 문제에 대해 거의 고려하지 않습니다 (가장 중요한 편차를 선택하는 것이 가장 좋은 이유는 무엇입니까?).

다음 게시물 중 일부에서 가치를 찾을 수 있습니다.

Shapiro–Wilk가 최고의 정규성 검정입니까? Anderson-Darling과 같은 다른 테스트보다 더 나은 이유는 무엇입니까?

크레이머 - 폰 - 미제스 대 앤더슨 - 달링 대 2 샘플 콜 모고 로프 - 스 미르 노프 두 샘플 테스트에 대한 (그러나 문장의 대부분은 이월

분포 사이의 Kolmogorov 거리에 대한 동기 부여 (보다 이론적 인 논의이지만 실제적인 의미에 대한 몇 가지 중요한 사항이 있음)


Cramer-von Mises 및 Anderson Darline 통계에서 cdf에 대한 신뢰 구간을 작성할 수 있다고 생각하지 않습니다. 기준은 최대 값이 아니라 모든 편차를 기반으로하기 때문입니다.


나는 "최신 기술"을 사용하여 구식이 아닌 사용을 찾는 것을 의미했습니다. 다중 적합도 정의의 존재는 적합도는 단일 개념이 아님을 우리에게 신호해야합니다. "양호"는 회귀를 수행하는 "이유"에 따라 달라집니다. 효과 C의 최상의 예측 변수를 얻기 위해 모델 A를 데이터 B에 맞추고 있다고 가정합니다. 그러면 "양호"는 B가 아닌 C의 최상의 예측 변수입니다. 그러나 대부분 B와 C의 차이점에 대한 질문은 무시됩니다.
Carl

1
@ 칼 당신은 예술의 상태 가 일반적으로 무엇 을 의미 하는지에 대한 사전 (또는 위키 백과)을 확인하고 싶을 수도 있습니다 . 구절에 대한 해석은 대부분의 사람들이 구절을 읽는 방식이 아닙니다. 사전은 다음과 같이 말합니다. " 최신 기술을 도입 한 최신 아이디어주어진 시간에 최고 수준의 개발 "과 " 최신 기술을 사용하는 최신 개발 단계 ". 이러한 맥락에서 적합도를 테스트하는 문구는 "지금 우리가 할 수있는 최선의 방법"을 의미합니다. 나는 그것이 단일 테스트에 대해 실제로 말할 수있는 것이 아니라고 주장합니다. ... ctd
Glen_b-복지국 Monica

2
... 예를 들어 Shapiro-Wilk (정상 테스트에서 매우 인기있는)와 같은 인기있는 테스트는 모든 상황에서 그렇지는 않지만 (예 : Shapiro & Chen 1995 참조) 훨씬 우수한 성능을 가진 경쟁 업체를 보유하고 있다고 말할 수 있습니다. 최선의 선택은 없습니다 (따라서 실제 '최신 상태'는 없습니다). 확실히 나는 (최신의) 최상의 것이 상황에 달려 있다는 것에 동의합니다. --- 이것이 내 대답의 요점입니다. 가능한 답변은 무수합니다. 한 상황에서 좋은 것이 다른 상황에서는 매우 열악 할 수 있습니다. "최고의 결과"를 단일 테스트처럼 요구하기보다는 테스트가 언제 제대로 수행되는지 아는 비용을 지불합니다.
Glen_b-복지 주 모니카

사실, 당신의 정의가 더 정확합니다. 그러나, 방법의 테스트보다 더 많은 방법이 있으며, "최신 기술"은 대체로 허구입니다. 즉 "예술"에는 "국가"가 없습니다. 그런 성실한 자세에 대한 반응은 모호합니다. 나는 '예'라고 말했고 당신은 '아니오'라고 말했고 우리 둘 다 같은 것을 말했습니다.
Carl

BTW, 질문은 "최신 상태"또는 "대치 된 것"인데, "폐기되었거나 쓸모가 없다"는 의미입니다. 내 대답에 대한 문맥은 " '예술의 상태'와 '대체'는 반의어라고 가정하고 그 중 하나를 선택하십시오." 당신은 그것들이 반의어가 아니라는 것이 맞습니다. 나는 맥락에서 대답하고 있었고 당신은 질문을 구걸하기로 결정했습니다. 그래서, 나는 정중 한 대답이었습니다. 그리고 나는 정중하지는 않지만 유익한 정보라고 생각하기 때문에 귀하의 답변에 투표하려고합니다.
Carl

2

Anderson-Darling 검정은 모든 분포에서 사용할 수있는 것은 아니지만 적은 수의 샘플을 제외하고 Shapiro-Wilk 검정의 검정력과 비슷하고 Razali NM, Wah YB 에서 동등한 두 검정력을 갖습니다 . Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors 및 Anderson-Darling 테스트의 검정력 비교. 통계 모델링 및 분석 저널. 2011; 2 : 21-33. 그러나 Shapiro-Wilk 테스트 는 정규 분포 테스트에만 해당됩니다. Cramér-von Mises 검정과 Pearson Chi-squared는 히스토그램에 대한 모든 분포 적합에 대해 일반적이며 Cramér-von Mises 검정은 Pearson Chi-squared보다 더 강력한 검정력을 가지고 있다고 생각합니다. 크레이머 - 폰 미제스 테스트n=400 Kolmogorov-Smirnov 검정보다 강력한 누적 밀도 함수 적합도 검정이며 t 검정보다 크거나 작은 검정력을 가질 수 있습니다. 카이 제곱은 셀 수가 적 으면 어려움이 있으므로 꼬리를 맞추는 데 범위 제한이 사용됩니다.

** 질문 1 : ...이 두 가지 방법은 ... 최첨단 기술입니까? 아니면 이미 더 나은 접근법으로 대체 되었습니까? 질문 2 이러한 테스트의 신뢰 구간은 얼마입니까? **

답 : 그들은 최첨단입니다. 그러나 때로는 확률 구간이 아닌 신뢰 구간을 원합니다. 이 방법들을 서로 비교할 때 우리는 신뢰 구간보다는 힘에 대해 말합니다. 때때로 적합도는 적합도의 확률과 대조적으로 AIC, BIC 및 기타 기준을 사용하여 분석되며, 때로는 적합도가 적합도의 기준이 아닌 경우 적합도 기준과 관련이없는 경우가 있습니다. . 후자의 경우, 회귀 목표는 피팅과 관련이없는 물리량 일 수 있습니다 (예 : Tk-GV 참조) .


NB Anderson-Darling 테스트는 Cramer-von Mises 테스트의 가중치 버전입니다. & 그 것처럼, 어떤 지속적인 분포에 적합합니다.
Scortchi-복원 Monica Monica
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.