가설 검정에 높은 양의 첨도가 문제가되는 이유는 무엇입니까?


14

나는 잔차의 긍정적 인 첨도가 정확한 가설 검정과 신뢰 구간 (따라서 통계적 추론에 문제가 있음)에 문제가 될 수 있다고 들었습니다 (죄송합니다. 이것이 사실입니까? 그렇다면 그 이유는 무엇입니까? 높은 양의 첨도 잔차가 잔차의 대부분이 잔차 평균 0에 가까워서 잔차가 적다는 것을 나타내지 않습니까? (답이 있다면 수학적으로 크게 기울이지 않았으므로 깊이있는 수학을 많이 사용하지 마십시오.)


4
이상적인 (가우스) 오류 조건이 이상적인 모델에 집중하고 있다고 생각합니다. (많은 다른 맥락에서, 잔차의 높은 첨도는 잘 예상 될 수 있습니다.) 높은 첨도는 대부분 정상보다 꼬리가 더 먼 분포를 암시 할 가능성이 높으므로, 매우 높은 (+ 또는-) 잔차입니다. 제로 근처에 많은 사람들이 있더라도 좋은 소식 일 뿐이며주의를 기울여야하는 나쁜 소식 일 수도 있습니다. 그러나 결국 그것은 많은 것을 의미 할 수 있습니다. 잔차 대 적합도는 일반적으로 더 유익합니다.
Nick Cox

실제로, 나는 정규 가정을 가진 모델에 집중하고있었습니다.
DDK

답변:


15

[...]는 높은 양의 첨도 잔차가 정확한 가설 검정과 신뢰 구간 (따라서 통계적 추론 문제)에 문제가 될 수 있다고 들었습니다. 이것이 사실입니까? 그렇다면 그 이유는 무엇입니까?

어떤 종류의 가설 검정에는 맞습니다.

높은 양의 첨도 잔차가 잔차의 대부분이 잔차 평균 0에 가까워서 잔차가 적다는 것을 나타내지 않습니까?

아니.

분산의 개념을 첨도의 개념과 일치시키는 것처럼 보입니다. 분산이 더 작 으면 잔차가 적고 잔차가 적은 경향이 있습니다. 첨도를 변경하는 동안 표준 편차를 일정하게 유지한다고 가정합니다 (따라서 분산보다는 첨도의 변경에 대해 분명히 이야기하고 있습니다).

다른 분산을 비교하십시오 (그러나 동일한 첨도).

여기에 이미지 설명을 입력하십시오

첨도는 다르지만 분산은 동일합니다.

여기에 이미지 설명을 입력하십시오

( 이 게시물의 이미지 )

높은 첨도는 많은 경우 평균 편차가 . 정규 분포보다 더 작은 잔차가 있습니다. 그러나 표준 편차를 같은 값으로 유지하려면 더 많은 값이 있어야합니다. 잔차 (잔차가 작을수록 평균에서 일반적인 거리가 더 작기 때문에). 큰 잔차와 작은 잔차를 더 많이 얻으려면 "표준 크기의"잔차 (평균에서 1 표준 편차 정도)가 더 적습니다.

"소형"을 정의하는 방법에 따라 다릅니다. 당신은 단순히 당신이 그것을 보상하기 위해 뭔가가 필요, 큰 잔차 길게 분산 상수를 많이 추가 할 수 없습니다 -하지만 일부 제공 "작은"의 측정하면 특정 조치를 증가시키지 않고 첨도을 높일 수있는 방법을 찾을 수 있습니다. (예를 들어, 높은 첨도는 자동으로 더 높은 피크를 의미하지는 않습니다)

첨도가 높을수록 분산을 일정하게 유지하더라도 잔차가 더 커지는 경향이 있습니다.

또한, 일부 경우에, 작은 잔차의 집중은 실제로보고있는 것에 따라 가장 큰 잔차의 추가 부분보다 더 많은 문제를 야기 할 수 있습니다.]

어쨌든 예제를 보자. 1- 표본 t- 검정과 10의 표본 크기를 고려하십시오.

t- 통계량의 절대 값이 2.262보다 클 때 귀무 가설을 기각하면 관측치가 독립적이고 정규 분포와 동일하게 분포되고 가설 된 평균이 실제 모집단 평균 일 때 귀무 가설을 기각합니다 가설 5 %.

정규 분포보다 첨도가 상당히 높은 특정 분포를 고려하십시오. 인구의 75 %는 정규 분포에서 도출 된 값을 가지며 나머지 25 %는 표준 편차를 50 배 큰 정규 분포에서 도출합니다.

올바르게 계산하면 12의 첨도 (과도 첨도 9)에 해당합니다. 결과 분포는 정규 분포보다 훨씬 정점에 가까우며 꼬리가 짙습니다. 밀도는 아래의 일반 밀도와 비교됩니다. 더 높은 피크를 볼 수 있지만 왼쪽 이미지에서 더 큰 꼬리를 볼 수 없으므로 밀도의 로그를 플로팅하여 아래쪽 부분을 펼칩니다. 이미지와 상단을 압축하여 피크와 꼬리를 더 쉽게 볼 수 있습니다.

여기에 이미지 설명을 입력하십시오

"5 %"1- 표본 t- 검정을 수행하는 경우이 분포 의 실제 유의 수준이 0.9 % 미만입니다. 이것은 상당히 극적이며, 전력 곡선을 상당히 크게 낮 춥니 다.n=10

또한 신뢰 구간의 적용 범위에 실질적인 영향을 미칩니다.

같은 첨도를 가진 다른 분포는 유의 수준에 다른 영향을 미칩니다.


그렇다면 왜 거부율이 낮아 집니까? 꼬리가 무거울수록 특이 치가 몇 개 더 커져 평균보다 표준 편차에 약간 더 큰 영향을 미치기 때문입니다. 이는 임계 영역에서 값의 비율을 감소시키는 과정에서 -1과 1 사이에서 더 많은 t- 값을 초래하기 때문에 t- 통계량에 영향을 미칩니다.

평균이 가정 된 평균보다 훨씬 높은 정규 분포에서 나온 것과 상당히 일관된 표본을 추출한 경우 평균보다 가장 먼 곳에서 관측 값을 가져와 더 멀리 가져옵니다 (즉, 평균을 보다 더 크게 만드는 경우 ) 실제로 t- 통계량을 더 작게 만듭니다.H0

보여 드리겠습니다. 다음은 크기가 10 인 샘플입니다.

 1.13 1.68 2.02 2.30 2.56 2.80 3.06 3.34 3.68 4.23

(1 표본 t- 검정) 에 대해 테스트하려고한다고 상상해보십시오 . 여기에서 표본 평균은 2.68이고 표본 표준 편차는 0.9424입니다. 5 % 검정 (p- 값 0.0484)에 대한 기각 영역에서 t- 통계량은 2.282입니다.H0:μ=2

이제 가장 큰 값을 50으로 만드십시오.

      1.13 1.68 2.02 2.30 2.56 2.80 3.06 3.34 3.68 50

분명히 우리는 평균을 끌어 올렸으므로 이전보다 훨씬 더 큰 차이를 나타내야합니다. 글쎄요, 그렇지 않습니다. t- 통계량이 줄어 듭니다 . 현재는 1.106이며 p- 값은 상당히 큽니다 (30 %에 가까움). 어떻게 된 거예요? 음, 우리는 평균을 7.257로 끌어 올렸지 만 표준 편차는 15를 넘었습니다.

표준 편차는 평균보다 특이 치에 약간 더 민감합니다. 특이 치를 넣을 때 1- 표본 t- 통계량을 1 또는 -1쪽으로 밀는 경향이 있습니다.

여러 특이 치가 발생할 가능성이있는 경우에는 종종 반대쪽에있을 수있는 경우에만 동일하게 발생합니다 (이 경우 표준 편차가 한 단계 이상일 때 평균에 미치는 영향이 줄어드는 반면 표준 편차는 훨씬 더 부풀어 짐). 0에 가까워지는 경향이 있습니다.

비슷한 것들이 정규성을 가정하는 다른 많은 일반적인 테스트와도 관련이 있습니다. 첨단이 높을수록 꼬리가 무거울수록 더 특이 치가 높아져 평균에 비해 표준 편차가 부풀려 져서 차이를 포착하려는 경향이 있습니다. 특이 치가 테스트에 미치는 영향으로 인해 "늪에 빠지게"됩니다. 즉, 저전력입니다.


1
와우, 매우 명확하고 정교한 답변에 감사드립니다. 당신의 시간은 대단히 감사합니다!
DDK

표본 평균의 큰 표본 분포가 첨도에 의존하지 않는 반면, 평균에 대한 정규성 가정 검정의 실제 유의 수준은 공칭 수준, 일반적으로 .05로 수렴한다는 점에 주목할 가치가 있습니다. 모든 유한 한 첨도에 대해 무한대), 분산 검정에 대해서도 동일하지 않습니다. 추정 분산의 큰 표본 분포는 첨도에 따라 달라 지므로 첨도가 0과 다를 때 분산에 대한 고전적인 정규성 가정 검정의 실제 유의 수준은 공칭 수준 n-> 무한대로 수렴하지 않습니다.
피터 웨스트 폴

또한, 첨도가 높을수록 수학적으로 "평균에서 더 작은 편차"가 있음을 의미하지는 않습니다. 그것이 확실히 당신에게 알려주는 것은 꼬리에 더 많은 것이 있다는 것입니다.
피터 웨스트 폴

더 작은 편차를 만들지 않으면 더 큰 편차를 얻 거나 분산을 일정하게 유지할 수 없습니다 . 분산을 일정하게 유지하지 않으면 새 척도에 비해 편차가 더 작아집니다. 그렇습니다. 첨도를 볼 때 수학은 더 큰 운반이 더 작다는 것을 알려줍니다.
Glen_b-복지 주 모니카

@Peter 를 표준화 된 로 하자 . 첨도는 이고 는 에서 단조입니다 . 확률을 의 꼬리 쪽으로 더 이동하면 일부 확률이 평균쪽으로 이동해야합니다 (또는 보유 할 수 없음 ). 마찬가지로 확률을 의 꼬리로 더 옮기고 분산을 증가 시키면 가 더 넓어 지므로 적어도 일부 값 의 경우 나머지 분포의 더 많은 값이 해당 범위 안에 들어가는 경향이 있습니다. ; 새로운 를 표준화하면 ( 에서X κ = E ( Z 4 ) ZXκ=E(Z4)κZVar(Z)=1Xμ±kσkXX'Z'κ1=E(Z2)κZVar(Z)=1Xμ±kσkXXZ예를 들어, 그 직접적인 의미에서 더 작은 값을 갖습니다.
Glen_b-복지 주 모니카

4

첨도는 특이 치를 측정합니다. 특이 치는 정규 분포를 기반으로하는 표준 추론 (예 : t- 검정, t- 간격)에 문제가 있습니다. 그게 끝이야! 그리고 이것은 정말 간단한 이야기입니다.

이 이야기가 잘 이해되지 않는 이유는 첨도가 "말하기"를 측정하는 고대 신화가 지속되기 때문입니다.

다음은 첨도가 왜 "말하기"가 아닌 특이 치를 측정하는지 보여주는 간단한 설명입니다.

다음 데이터 세트를 고려하십시오.

0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1

첨도는 (z- 값) ^ 4의 예상 값입니다. 다음은 (z- 값) ^ 4입니다.

6.51, 0.30, 5.33, 0.45, 0.00, 0.30, 6.51, 0.00, 0.45, 0.30, 0.00, 6.51, 0.00, 0.00, 0.30, 0.00, 27.90, 0.00, 0.30, 0.45

평균은 2.78이며 이는 첨도의 추정치입니다. (과도한 첨도를 원하면 3을 빼십시오.)

이제 마지막 데이터 값을 999로 바꾸어 이상 치가되도록합니다.

0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999

자, 여기 (z- 값) ^ 4가 있습니다 :

0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00,0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 360.98

평균은 18.05이며 첨도의 추정치입니다. (과도한 첨도를 원하면 3을 빼십시오.)

분명히 특이 치 만 중요합니다. "피크"나 중간 부근의 데이터에 관한 것은 없습니다.

두 번째 데이터 세트로 표준 통계 분석을 수행하면 문제가 발생할 수 있습니다. 큰 첨도는 문제를 경고합니다.

다음은 정교한 논문입니다.

웨스트 폴, PH (2014). 정점으로서의 첨도, 1905 – 2014. RIP 미국 통계 학자, 68, 191–195.


왜 비모수 적 테스트를 사용하지 않습니까? 이러한 유형의 문제에 대해서는 우수 할 가능성이 높습니다.
Carl

1
테스트를 좋아한다면 가능한 한 번의 방법으로 동의합니다. 이는 고전적인 형태로는 빠르게 관심을 끌지 못하고 있습니다. 그러나 그것은 실제로 나의 관심사가 아니다. 나는 확률 론적 모델링에 더 관심이있다. 하나의 응용 : 아마도 당신은 실제로 평균에 관심이있을 것입니다. 예를 들어, 종속 변수가 돈을 버는 경우, 프로세스 평균은 프로세스 중앙값보다 더 흥미 롭습니다. 그렇다면 데이터가 특이 할 때 프로세스의 의미에 대해 데이터는 무엇을 알려줍니까? 어려운 문제이지만 중요한 문제이며 순간 첨도는 답과 관련이 있습니다. 비 파 테스트가 아닙니다.
Peter Westfall

코시 분포의 경우 잘린 평균이 중앙값보다 위치를 더 잘 측정 할 수 있으며 일반적인 평균은 위치를 측정하지 않습니다. 위치 측정으로 사용할 것은 분포가 무엇인지에 달려 있습니다. 첨도가 지표로 도움이되지 않는 예는 평균 극단 값이 중간 값과 평균값보다 위치를 더 잘 측정하는 균일 분포입니다.
Carl

요점이 아닙니다. 총액 (예 : 달러)에 관심이있는 경우 일반적인 평균은 원하는 위치 측정입니다.
피터 웨스트 폴

Cauchy 분산 변수가있는 경우 총 수익을 올릴 수 있지만 평균은 "예상 값"과 관련하여 합리적인 기대치가 없음을 의미하는 특히 유용한 위치 측정 방법이 아닙니다.
Carl

-3

첨도는 비대칭 꼬리를 나타냅니다. 양측 가설 검정에서 한쪽 꼬리는 긴 꼬리이고 다른 꼬리는 짧은 꼬리입니다. 꼬리 중 하나는 알파이지만 <베타 일 수 있습니다. 한 꼬리는 p- 값을 통과하지만 다른 꼬리는 통과하지 않습니다.

기본적으로 통계적 추론은 표준 정규를 가정합니다. 표준 정규가 아닌 경우 좀 더 복잡한 추론 기법을 기반으로 추론 할 수 있습니다. 포아송 추론을 할 수는 있지만 정규 분포가 아닌 정규 분포를 따르는 추론은 사용할 수 없습니다.

왜곡 및 첨도는 비정규 성의 척도입니다. 정규성 검정을 수행하기 전에 정규 분포를 사용하고 정규 분포를 사용하는 방법을 배웁니다. 법선은 각 차원에서 36 개 이상의 데이터 점이 필요합니다. 20 개의 데이터 포인트를 추정 할 수 있지만 여전히 치우침 및 첨도가 발생합니다. 분포가 정규에 가까워지면 기울기와 분포가 사라집니다.

설명 중 하나는 첨도를 정점으로 정의했습니다. 다른 사람은 그렇지 않았습니다. 이것은 현재 해결되지 않은 싸움입니다. Kurtosis는 네 번째 순간 인 지역입니다. 나는 문제의 정점에 있지 않다.

또 다른 아이디어는 비뚤어 짐에 따라 중앙값이 삼각형을 형성하는 모드로 기울어진다는 것입니다. 즐겨.


1
이것이 이미 훌륭한 답변과 유용하고 다른 것을 추가한다는 것은 확실하지 않습니다. 예를 들어 "정상적으로 36 개 이상의 데이터 포인트가 필요하다"는 몇 가지 수수께끼를 추가 할 수있다. (그래서 35 개는 안된다.이 주장의 기초는 무엇인가? 표준 정규 ": 일반적으로 아님. Kurtosis는 네 번째 모멘트, 면적 : 아니오; 여기에 정의 된 첨도는 평균에 대한 네 번째와 두 번째 모멘트를 기반으로 한 무 차원 비율입니다.
Nick Cox

네 번째 순간은 필수이므로 영역입니다. 이 영역이 정점 또는 곡률로 변환되는 방식이 저에게 없어집니다.
David W. Locke

첨도의 전형적인 설명은 정점이지만 내 견해로는 잘못되었습니다. 첨도가 최고라고 말하기 때문에 왜도를 변경하기 위해 원래의 응답을 편집하겠습니다.
David W. Locke

꼬리는 대칭이 아닙니다. 비대칭 꼬리를 고려한 통계적 추론에 대해서는 전혀 본 적이 없습니다. 더 많은 데이터 포인트가 수집 될 때 꼬리가 움직이기 때문에 첨도 위험이 발생합니다. 비대칭 및 첨도는 표준 정규를 달성하기에 충분한 데이터가 없습니다.
David W. Locke

1
그렇지 않다 : 지수, 감마,와 이블 (Wilbull), 그리고 정상이 아닌 많은 다른 분포에 대한 수많은 이론과 응용이있다.
닉 콕스
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.