문제의 데이터가 무엇인지, 그리고 얼마나 많은 데이터를 알고 싶어하는지에 따라 결정됩니다. 으로 @whuber 최근 채팅에서 말했다 , "물리 법칙이 관련되는 경우, 당신은 거의 항상 데이터를 모델링 할 수있는 적절한 방법에 대해 합리적인 추측을 할 수 있습니다." (이것이 나보다 사실이라고 생각합니다! 또한 이것이 원래의 맥락에서 잘못 적용되지 않기를 바랍니다 ...) 사회 과학의 잠재 구조 모델링과 같은 경우에는 종종 초점을 맞추는 것이 유용합니다 덜 알려진 현상의 뉘앙스를 이해하는 방법으로 경험적 분포. 정규 분포를 가정하고 전체 형태의 부적합을 무시할 정도로 무시하는 것은 다소 쉽지 않으며, 이상 치가 틀린 것보다 더 정당화되지 않고 잘못된 것으로 기각하는 것은 상당히 특이합니다. '
물론,이 행동의 많은 부분은 적용하고자하는 분석의 가정에 의해 동기가 부여됩니다. 가장 흥미로운 질문은 종종 변수 분포의 설명이나 분류를 넘어선 것입니다. 이것은 또한 주어진 시나리오에 대한 정답에 영향을 미칩니다. 비모수 적 방법 과 강력한 방법이 완벽 하지 않기 때문에 정규 분포가 특히 적합하지 않은 경우 (예 : 전력 요구) 이유가있을 수 있습니다 . 그럼에도 불구하고, 습관적으로 그렇게 할 위험은 단일 변수의 분포에 관해 흥미로운 질문을하는 것을 잊어 버리는 것입니다.
예를 들어, 사람들이 일반적으로 묻고 싶은 인기있는 질문 인 부와 행복의 관계를 생각해보십시오. 부는 감마 (Salem & Mount, 1974) 또는 일반 베타 (Parker, 1999) 분포를 따른다고 가정하는 것이 안전 할 수 있지만 행복이 정상적으로 분배된다고 가정하는 것이 실제로 안전합니까? 실제로, 원래의 질문에 대답하기 위해 이것을 전혀 가정 할 필요는 없지만 사람들은 때때로 응답하고 응답 편향 및 문화적 차이와 같은 잠재적으로 중요한 문제를 무시합니다. 예를 들어, 일부 문화권은 다소 극단적 인 반응을 보이는 경향이 있으며 (리 커트 항목으로 구성된 설문지의 요인 분석에 대한 @chl의 답변 참조 ), 규범은 긍정적 감정과 부정적인 감정의 열린 표현에 따라 다릅니다 (터커, 오 제르, 류보 미르 스키, & 보엠, 2006 ) . 이것은 왜도 및 첨도와 같은 경험적 분포 특성의 차이의 중요성을 증가시킬 수 있습니다. 러시아, 중국, 미국에서 부의 관계를 주관적인 행복 등급과 비교한다면 행복 등급의 중심 경향의 차이를 평가하고 싶을 것입니다. 그렇게 할 때, 일원 분산 분석을 위해 각각에 대한 정규 분포를 가정하는 것이 주저합니다 ( 위반에 대해서는 상당히 강력 할 수 있음)) 다양한 문화 의존적 규범과 응답 편견으로 인해 중국에서 "꼬리 꼬리"분포, 러시아에서는 긍정적으로 치우친 분포, 미국에서는 부정적인 비뚤어진 분포를 기대할 이유가있을 때. 유의성 테스트를 위해 (실제로 효과 크기를보고하는 것을 선호하더라도) 비모수 적 방법을 사용하고 각 모집단의 주관적 행복을 실제로 이해하기 위해 오히려 분포를 실증적으로 설명하여 단순한 이론적 분포로 분류하고 모든 부적합에 대한 무시 또는 광택을 시도하십시오. 그것은 정보 IMO의 낭비입니다.
참고 문헌
-Parker, SC (1999). 수입 분배 모델로 일반화 된 베타. 경제 서신, 62 (2), 197–200.
-Salem, ABZ, & Mount, TD (1974). 소득 분배의 편리한 설명 모델 : 감마 밀도. 계량 경제학, 42 (6), 1115-1127.
-터커, KL, 오 제르, DJ, Lyubomirsky, S., & Boehm, JK (2006). 수명 척도 만족도의 측정 불일치 테스트 : 러시아와 북미의 비교. 사회 지표 연구, 78 (2), 341–360. http://drsonja.net/wp-content/themes/drsonja/papers/TOLB2006.pdf 에서 검색했습니다 .