분산 분석의 정규성 가정에서 출발 : 첨도 또는 왜도가 더 중요합니까?


12

Kutner 등의 응용 선형 통계 모델. ANOVA 모델의 정규성 가정에서 벗어난 것과 관련하여 다음과 같이 설명 합니다. 오차 분포의 첨도 (정규 분포보다 많거나 적은 피크)는 추론에 미치는 영향 측면에서 분포의 왜도보다 중요합니다 .

나는이 진술에 약간 당황하고 책이나 온라인에서 관련 정보를 찾지 못했습니다. 또한 꼬리가 두꺼운 QQ- 플로트는 선형 회귀 모델에 대해 정규성 가정이 "충분히 충분 함"을 나타내는 반면, 비틀린 QQ- 플로트는 더 큰 문제입니다 (즉, 변환이 적절할 수 있음)는 것을 알고 혼란 스러웠습니다. .

나는 동일한 추론이 ANOVA에 적용되고 그들의 단어 선택 ( 추론에 미치는 영향 측면에서 더 중요 함 )이 잘못 선택 되었다는 것이 맞 습니까? 즉, 치우친 분포는 더 심각한 결과를 초래하므로 피해야하지만 소량의 첨도는 허용 될 수 있습니다.

편집 : rolando2에 의해 다루어 진 것처럼, 모든 경우에 하나가 다른 것보다 더 중요하다고 말하기는 어렵지만, 나는 단지 일반적인 통찰력을 찾고 있습니다. 내 주요 문제는 간단한 선형 회귀 분석에서 F- 검정이 이것에 대해 상당히 강력하기 때문에 더 두꺼운 꼬리를 가진 QQ 플로트 (= 커토 시스?)가 정상이라는 것을 배웠습니다. 반면, 기울어 진 QQ- 플롯 (포물선 모양)이 일반적으로 더 큰 문제입니다. ANOVA 모델이 회귀 모델로 변환 될 수 있고 동일한 가정이 있어야하더라도 이것은 내 교과서에서 ANOVA에 제공하는 지침과 직접적으로 일치하는 것 같습니다.

나는 무언가를 간과하고 있거나 잘못된 가정을 가지고 있다고 확신하지만 그것이 무엇인지 알 수는 없습니다.


3
첨도에 대한 그의 검토에서 DeCarlo (1997)는 왜곡이 분산 분석과 다른 평균 평등성 검정에서 더 중요하다는 것과 정반대라고 제안했다. 당신은 유용하게 297 페이지의 인용을 찾을 수 있습니다 columbia.edu/~ld208/psymeth97.pdf
안토니

1
___ 수준의 왜도는 일반적으로 ___ 수준의 첨도보다 결과가 왜곡 될 수 있도록 첨도보다 추론에 훨씬 더 중요합니다. " 그러한 수량 화가 없다면, 단지 하나 또는 다른 것이 더 중요하다고 말하는 것이 우리에게 큰 도움이되지 않습니다.
rolando2

이 시뮬레이션 emis.de/journals/HOA/ADS/Volume7_4/206.pdf Khan and Rayner (2003)의 응용 수학 및 결정 과학 저널 ( Journal of Applied MATHEMATICS AND DECISION SCIENCES)의 "ANOVA 및 Kruskal-Wallis 테스트는 첨도의 영향을 크게받습니다. "비대칭 성보다는 오차 분포의"(p. 204).
bsbk

2- 표본 t- 검정과 관련하여 매우 밀접한 관련이있는 질문 (효과적으로 요인에 두 수준이있는 일원 분산 분석)은 stats.stackexchange.com/questions/38967/… 입니다. 현재 추가 된 현상금이 있습니다. 기존 답변 중 인용이 포함되지 않은 참조는이 질문에 대한 답변자가이를 살펴볼 수 있습니다.
Silverfish

나는 @ rolando2에 동의합니다 : "왜곡이 첨도보다 나쁘다"또는 그 반대도 왜곡 정도를 언급하지 않고 다소 공허한 진술입니다. 그러나 더 많은 것을 고려해야합니다! 예를 들어, 이러한 종류의 정규성 위반에 대한 견고성은 부분적으로 그룹 크기가 같은지 여부에 달려 있으며 , 왜도에 대한 견고성은 왜도 방향에 따라 달라질 수 있습니다. 한 그룹이 한 방향으로 비뚤어지고 다른 그룹이 반대로 두 그룹이 같은 방향으로 치우친 것보다. (이것은 기억력과 재시험에서 비롯되었지만 일종의 분산 분석입니다.)
Silverfish

답변:


6

어려움은 왜도 및 첨도가 의존적이라는 것입니다. 그들의 효과는 완전히 분리 될 수 없습니다.

문제는 치우친 분포의 영향을 조사하려면 첨도가 높은 분포도 있어야한다는 것 입니다.

2+1

* (과도한 첨도가 아닌 보통의 네 번째 순간 첨도)

칸과 레이너 (이전 답변에서 언급)는 왜 도와 첨도의 영향을 조사 할 수있는 가족과 함께 일하지만이 문제를 피할 수는 없으므로 분리하려는 시도는 그 영향의 정도를 심각하게 제한합니다. 왜도를 탐색 할 수 있습니다.

β2β21

예를 들어, 왜도> 5와 같이 높은 왜도의 영향을 보려면 26 미만의 첨도 분포를 구할 수 없습니다 !

따라서 높은 왜도의 영향을 조사하려면 높은 첨도의 영향을 조사하지 않아도됩니다. 따라서 분리하려고하면 실제로 왜도 증가의 영향을 높은 수준으로 평가할 수 없습니다.

그러나 최소한 그들이 고려한 배급 군과 그들 사이의 관계가 갖는 한계 내에서 칸과 레이너의 조사는 첨도가 주요한 문제라고 암시하는 것으로 보인다.

>2


11

이 문제는 Khan과 Rayner의 "다 표본 위치 문제에 대한 일반적인 테스트의 비정규성에 대한 견고성" 에서 해결되었습니다 .

그들은 분산도 시험이 왜도보다 첨도에 의해 훨씬 더 많은 영향을 받았으며, 왜도의 영향은 방향과 관련이 없음을 발견했습니다.

정규 성과의 편차가 의심되는 경우 Kruskal-Wallis 검정이 더 나은 선택 일 수 있습니다. Kruskal-Wallis 검정은 치료 중간 값 이 동일하다는 가설을 조사하기 때문에 정규성 편차에 대해 더 강력 합니다. 분산 분석은 처리 방법 이 동일하다는 가설을 조사합니다 .


그러면 선형 회귀 및 분산 분석에 대해 QQ- 플롯을 다르게 해석해야 함을 나타 냅니까? 내가 한 변형의 대부분은 왜도를 줄 였지만 약간 두꺼운 꼬리를 남겼습니다 (= 커토 시스?). 나는 F- 테스트가 후자를 다룰 수있을 정도로 견고했지만 전자는 아니었다는 인상을 받았다. 아니면이 "무거운 꼬리는 괜찮습니다"라는 오해가 있습니까? 분산 분석 모델을 선형 회귀 모델로 다시 작성할 수 있기 때문에 둘 사이에 근본적인 차이가 있다고 상상할 수 없습니다.
제니트
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.