평균에 대한 견고한 t- 검정


17

임의의 변수 에 대해 로컬 대체 에 대해 null 을 테스트하려고 합니다. Wilcox의 '강력한 추정 및 가설 테스트 소개'에서 제안한 내용에 따라 나는 잘린 평균, 중간 값 및 위치의 M 추정기 (Wilcox ' "1 단계"절차)를 기반으로 한 테스트를 살펴 보았습니다. 이 강건한 검정은 기울어지지 않지만 렙 토쿠 르토 시스 분포를 사용하여 검정 할 때 검정력의 측면에서 표준 t 검정보다 성능이 우수합니다.E[X]=0E[X]>0X

그러나 치우친 분포를 사용하여 검정 할 때 이러한 단측 검정은 분포가 각각 왼쪽 또는 오른쪽으로 치우쳐 있는지 여부에 따라 귀무 가설 하에서 너무 자유롭거나 너무 보수적입니다. 예를 들어, 관측치가 1000 개인 경우 중앙값을 기반으로 한 검정은 실제로 공칭 5 % 수준에서 ~ 40 %의 시간을 거부합니다. 그 이유는 명백합니다. 비대칭 분포의 경우 중앙값과 평균이 다소 다릅니다. 그러나 응용 프로그램에서 잘린 평균이 아닌 중간이 아닌 평균을 테스트해야합니다.

실제로 평균을 테스트하지만 비대칭 및 첨도에는 영향을 미치지 않는 더 강력한 버전의 t- 검정이 있습니까?

이상적으로는 절개가없는 높은 첨도의 경우에도 절차가 잘 작동합니다. '1 단계'테스트는 '벤드'매개 변수가 상대적으로 높게 설정되어 거의 충분하지만, 스큐가 없을 때 트림 된 평균 테스트보다 강력하지 않으며, 스큐에서 공칭 레벨의 리 젝트를 유지하는 데 어려움이 있습니다. .

배경 : 중간 값이 아닌 평균에 대해 정말로 신경 쓰는 이유는 테스트가 재무 응용 프로그램에서 사용될 것입니다. 예를 들어, 포트폴리오에 긍정적 인 예상 로그 리턴이 있는지 테스트하려는 경우 실제로는 평균이 적절합니다. 포트폴리오에 투자하면 대신 모든 리턴 (샘플 수의 평균 시간)이 발생하기 때문입니다. 중앙값의 복제. 즉 , RV 의 드로우 의 합에 정말로 관심이 있습니다.nnX


Welch t-test의 사용을 금지하는 이유가 있습니까? 이 질문에 대한 나의 대답 ( stats.stackexchange.com/questions/305/… ) 을 살펴보십시오. 여기서 비정규 성과 이분법 성이있는 경우 Welch의 사용을 주장하는 논문을 참조하십시오.
Henrik

1
글쎄, 문제는 2 샘플 테스트가 아닌 1 샘플 테스트를 원한다는 것입니다! 내가 널 테스트입니다 , 그리고 E [ X 1 ] = E [ X 2 ] . Kubinger et. al., 종이 (Ich kann schlecht Deutsche). 이자형[엑스]=μ이자형[엑스1]=이자형[엑스2]
shabbychef

설명해 주셔서 감사합니다. 이 경우 Kubinger 용지는 도움이되지 않습니다. 미안 해요.
Henrik

답변:


5

왜 비모수 적 테스트를보고 있습니까? t- 검정의 가정이 위반 되었습니까? 즉, 서수 또는 비정규 데이터와 불일치 분산? 물론 표본이 충분히 크면 표본의 정규성에도 불구하고 더 큰 검정력으로 파라 메트릭 t- 검정을 정당화 할 수 있습니다. 마찬가지로 관심사가 분산이 같지 않은 경우 정확한 p- 값 (웰치 수정)을 산출하는 모수 검정에 대한 수정이 있습니다.

그렇지 않으면 결과를 t- 검정과 비교하는 것은 좋은 방법이 아닙니다. t- 검정 결과는 가정이 충족되지 않을 때 바이어스되기 때문입니다. Mann-Whitney U는 여러분이 정말로 필요로하는 적절한 비모수 적 대안입니다. t- 검정을 정당하게 사용할 수있을 때 (가정이 충족되기 때문에) 비모수 적 검정을 사용하는 경우에만 전력이 손실됩니다.

그리고 더 많은 배경을 얻으려면 여기로 가십시오 ...

http://www.jerrydallal.com/LHSP/STUDENT.HTM


데이터는 가장 정상적이지 않습니다. 초과 첨도는 10-20 정도이며, 기울기는 -0.2 ~ 0.2 정도입니다. 1- 표본 t- 검정을 수행하고 있으므로 '불균형 분산'또는 U- 검정에 대해 당신을 따르지 않을 것입니다.
shabbychef

'파라 메트릭 테스트 사용'조언을 수락합니다. 그것은 내 질문을 정확하게 해결하지는 못했지만 내 질문은 너무 개방적이었습니다.
shabbychef

12

그룹 평균이 다른지 또는 트리밍 된 평균 등의 차이를 테스트하는 것과 달리 그룹 평균이 다른지 실제로 테스트하려면 다른 가설을 테스트하는 비모수 테스트를 사용하고 싶지 않다는 데 동의합니다.

  1. 일반적으로 t- 검정의 p- 값은 잔차 정규성 가정의 적당한 출발점을 고려할 때 상당히 정확한 경향이 있습니다. 이 애플릿을 확인하여이 견고성에 대한 이해를 얻으십시오. http://onlinestatbook.com/stat_sim/robustness/index.html

  2. 정규성 가정 위반에 대해 여전히 우려되는 경우 부트 스트랩을 원할 수 있습니다 . 예 : http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf

  3. 또한 비대칭 종속 변수를 변환 하여 정규성에서 벗어나는 문제를 해결할 수 있습니다.


2
+1 좋고 명확한 답변. 제로미, 포인트 3에 대해 질문 할 수 있습니까? 나는 데이터 변환에 대한 추론을 이해하지만 항상 그 일을 방해했습니다. 변환 된 데이터에 대한 t- 테스트 결과를 변환되지 않은 데이터 (t- 테스트를 "허용하지 않음")에보고하는 타당성은 무엇입니까? 다시 말해, 데이터가 로그 변환 될 때 두 그룹이 다른 경우 원시 데이터가 어떤 기반이라고 말할 수 있습니까? 맨손으로, 나는 통계학자가 아니기 때문에 아마도 어리석은 말을했다. :)
nico

2
@nico 결과를보고하거나 생각하는 방법에 대해 잘 모르겠지만 X 및 Y, mu_X! = mu_Y에 대해 표시하려는 모든 것이 있다면 모든 X_i <X_j, log ( X_i) <log (X_j) 및 모든 모든 X_i> X_j에 대해 log (X_i)> log (X_j). 따라서 순위에 따라 작동하는 비모수 테스트의 경우 데이터 변환이 결과에 영향을 미치지 않습니다. 나는 이것으로, 어떤 테스트에서 mu_log (X)! = mu_log (Y), mu_X! = mu_Y라고 표시한다고 가정 할 수 있습니다.
JoFrhwld

답변 주셔서 감사합니다. 실제로, t- 검정은 약간 기울어 진 / 커 토틱 입력 하에서 공칭 유형 I 속도를 유지하는 것으로 보인다. 그러나 나는 더 많은 힘을 가진 것을 원했다. 재 : 2, 나는 윌콕스를 구현 한 ' trimpb그리고 trimcibt, 그러나 그들은 내 취향 적어도, 내 능력 테스트를 할 수있는 비트가 너무 느리다. 3 : 나는이 방법을 생각했지만 변환되지 않은 데이터의 평균에 관심이 있습니다 (즉, 2 RV를 t- 검정과 비교하지 않습니다.이 경우 단조로운 변환은 적합합니다. @JoFrhwld에 의해 언급 된 순위 기반 비교)
shabbychef

2
@nico 잔차의 모집단 분포가 두 그룹에서 동일하면 원시 모집단 그룹에 차이가있을 때마다 주문 보존 변환의 그룹 평균에 차이가 있음을 의미합니다. 즉, 원시 데이터를 사용하는지 변환 된 데이터를 사용하는지에 따라 p- 값과 신뢰 구간이 약간 변경되는 경향이 있습니다. 일반적으로 변수를 이해하기위한 의미있는 지표 (예 : 리히터 척도, 데시벨, 카운트 로그 등) 인 경우 변환을 사용하는 것이 좋습니다.
Jeromy Anglim


0

나는 논평으로 충분한 명성을 얻지 못했기 때문에 대답으로 : 계산을 살펴 보십시오. 나는 이것이 훌륭한 대답을 제공한다고 생각합니다. 간단히 :

점근 적 성능은 첨도 형태보다 왜곡 형태의 정규성 편차에 훨씬 더 민감합니다. 따라서 스튜던트 t- 검정은 왜도에 민감하지만 두꺼운 꼬리에 대해서는 상대적으로 견고하므로 검정을 사용하는 것이 합리적입니다. t- 검정을 적용하기 전에 스큐 대안에 대한 정규성.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.