로그 변환이 비정규 데이터를 t- 검정하는 데 유효한 기술입니까?


19

논문을 검토하면서 저자들은 "정규의 전제 조건 가정을 만족시키기 위해 t 개의 검정을 수행하기 전에 자연 로그를 사용하여 기울어 진 분포를 나타내는 연속적인 결과 변수를 변환했습니다"라고 말합니다.

비정규 데이터를 분석 할 수있는 적절한 방법입니까, 특히 기본 분포가 반드시 로그 정규성이 아닌 경우

이것은 매우 어리석은 질문 일지 모르지만 이전에는이 ​​일을 보지 못했습니다 ....


3
초기 분포가 로그 정규가 아닌 경우, 변환 된 데이터는 정규성에 대한 전제 조건 가정을 충족시키지 못하므로 변환으로 얻은 결과는 무엇입니까?
매크로

@ 매크로-충분히 사실! (+1)-아마도 분포를 대칭에 가깝게 만들고 싶었을 것입니다. 이는 t- 검정에 대해하고 싶지 않은 일이지만, 확인하고 작성하지 않으면 로그가 있는지 알 수 없습니다. 변환은 문제를 악화시킬 수있는 부정적 왜곡을 유발했습니다.
jbowman

2
우리는 정규성을 만족시키기 위해 수행되었고, 정규성이 처음부터 점검되었으므로, 그 후에 정규성이 점검되었다고 추론 할 수있다. 여기 언어에 강력하게 내재되어 있습니다.
John

10
로그에 대한 t- 검정은 변환되지 않은 데이터에 대한 t- 검정과 비모수 검정과 동일하지 않습니다. 로그의 t- 검정 은 (일반적인) 산술 수단이 아닌 기하학적 수단을 비교 합니다. 이는 로그 사용이 허용 가능한지 여부를 결정할 때 고려해야 할 몇 가지 중요한 고려 사항 중 하나입니다 (응용 프로그램에 따라 다를 수 있음).
whuber

답변:


9

일반적이지 않은 데이터가있을 때 어떤 종류의 변환을 정규성 (예 : 로그, 제곱근 등)에 적용하려고 시도하는 것이 일반적입니다. 대수는 왜곡 된 데이터에 대해 합리적으로 자주 좋은 결과를 낼 수 있지만이 특정 경우에는 제대로 작동 할 것이라는 보장은 없습니다. 또한 변환 된 데이터를 분석 할 때 @whubers는 위의 의견을 염두에 두어야합니다. "로그에 대한 t- 검정은 변환되지 않은 데이터에 대한 t- 검정과 비모수 검정과 동일하지 않습니다. 로그에 대한 t- 검정은 기하 비교 "(일반적인) 산술 수단이 아니라"

변환 된 데이터가 "정상적으로"보이는지 여부를 평가하려면 정규성으로 변환 한 후에는 항상 정규성 가정을 조사해야합니다. 예를 들어 히스토그램, QQ- 플롯 및 정규성 테스트를 사용하여 수행 할 수 있습니다. t- 검정은 왜도 형태의 정규성 편차에 민감하므로 비대칭 대안에 대한 정규성 검사가 바람직합니다. 피어슨의 샘플 왜도 는이 경우 적합한 검정 통계량입니다.n1i=1n(xix¯)3(n1i=1n(xix¯)2)3/2

대부분의 경우 작동하므로 변환 (예 : 로그)을 선택하는 대신 지정된 데이터를 사용하여 변환을 선택하기 위해 Box-Cox 프로 시저 를 사용하는 것이 좋습니다 . 그러나 이것에는 몇 가지 철학적 인 문제가 있습니다. 특히 어떤 변환을 사용할지 선택할 때 샘플의 일부 정보를 사용했기 때문에 이것이 t- 검정의 자유도에 영향을 미치는지 여부입니다.

마지막으로 변환 후 t- 검정을 사용하거나 기존의 비모수 적 테스트를 사용 하는 대신 t- 검정 의 부트 스트랩 아날로그 를 사용하는 것이 좋습니다 . 그것은 정규성의 가정을 요구하지 않으며 변형되지 않은 수단에 대한 시험 (그리고 다른 것에 대한 시험은 아님)입니다.


1
+1 마지막에 좋은 추천을받은 좋고 사려 깊은 토론. t- 테스트의 부트 스트랩 / 리샘플링 / 변경 버전에 대한 자세한 내용은 stats.stackexchange.com/q/24911 에서 최신 스레드를 참조하십시오 .
whuber

0

일반적으로 t- 검정을 수행하는 데 필요한 가정이 충족되지 않으면 비모수 적 테스트를 사용하는 것이 더 적합합니다.


5
아마도. 비 파라 메트릭 테스트는 거의 항상 비교 중간 값 (또는 다른 백분위)보다는 수단을 따라서 정말 약간 다른 질문을 해결합니다. 그러나 이것은 현재 질문에 대한 유용한 답변처럼 보이지는 않습니다.이 질문은 데이터 로그를 t 테스트하는 것에 대해 구체적으로 요구합니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.