다른 결과에 기초한 통계 테스트 선택 (예 : 정규성)


13

그래서 다른 결과를 바탕으로 한 통계 테스트를 선택하는 것은 좋지 않다고 들었습니다. 그래도 나에게는 이상해 보인다. 예를 들어, 다른 테스트에서 잔차가 정규 분포를 따르지 않는다고 제안 할 때 비모수 적 테스트를 사용하는 경우가 종종 있습니다. 이 접근법은 꽤 널리 받아 들여져 있지만이 단락의 첫 번째 문장에 동의하지 않는 것 같습니다. 나는이 문제에 대해 명확히하기를 바랐습니다.


3
잔차가 가우시안이 아니기 때문에 비모수 테스트가 필요하다는 의미는 아닙니다. 일반적으로 데이터의 특성 (횟수, 0 1 데이터, 연속, 평균-분산 관계, 선형 또는 비선형 관계 등)에서 사용할 모델 유형 (예 모델, 테스트 아님)을 식별하고 그에 따라 모델을 맞출 수 있습니다. 테스트 할 가설이 무엇인지 이전에 결정한 데이터의 기능을 충족합니다. 적합이 적합 모형의 가정을 충족한다고 생각하면 p- 값 및 기타 통계를 평가할 수 있습니다.
Reinstate Monica-G. Simpson

답변:


14

점을 감안 데이터를이 극단적 인 경우, 또는 더 극단적 인 관찰의 확률 사실은, 다음의 해석 무엇 생산하는 시험의 선택에서 만든 파견 결정이 있었다 과정을 통해 도착됩니다 그 ? 답은 알 수 없습니다 (또는 적어도 거의 알 수 없습니다). 다른 확률 론적 프로세스를 기반으로 테스트 실행 여부를 결정함으로써 결과의 해석을 더욱 복잡하게 만들 수 있습니다. H 0 p p p p ppH0pppp표본 크기 및 분석 계획이 사전에 완전히 선택되면 값을 최대한 해석 할 수 있습니다. 다른 상황에서는 해석이 어려워 지므로 '좋은 생각이 아닙니다'. 즉, 널리 채택 된 관행입니다 ... 결국 실행하려는 테스트가 유효하지 않다는 것을 알게되면 왜 테스트를 실행해야합니까? 그 질문에 대한 답은 확실하지 않습니다. 이것은 모두 귀무 가설 유의성 검정 ( 의 주요 사용 사례 )이 극복하기 어려운 몇 가지 문제가 있다는 단순한 사실로 요약됩니다 .p


Google에서이 현상에 대한 기사를 찾지 못했습니다. 잘못된 검색어를 사용했기 때문일 수 있습니다. 누군가 테스트를 기반으로 테스트 문제를 논의하는 기사의 방향을 알려 줄 수 있습니까?
Rob Hall

1
@RobHall : "가상 데이터에 대한 가상의 문제의 중요성"의 특정 사례입니다. Cf. Wagenmakers, 2007, p. 784. Wagenmakers는 특히 두 번째 열에서 "p 값을 계산하기 위해 데이터가 다르게 나왔을 때 수행해야 할 작업을 알아야합니다. 여기에는 데이터를 수행했을 때 수행 한 작업이 포함됩니다. 비정규 분포가 명확하게 분포되어 있었지만, p 값은 샘플링 계획을 완전히 알고 사전에 지정한 후에 만 ​​계산할 수 있습니다. "
russellpierce

8

예를 들어, 다른 테스트에서 잔차가 정규 분포를 따르지 않는다고 제안 할 때 비모수 적 테스트를 사용하는 경우가 종종 있습니다. 이 접근법은 꽤 널리 받아 들여져 있지만이 단락의 첫 번째 문장에 동의하지 않는 것 같습니다. 나는이 문제에 대해 명확히하기를 바랐습니다.

그렇습니다. 많은 사람들이 이런 종류의 일을하고 두 번째 검정을 등분 산 등을 거부 할 때 이분산성을 다룰 수있는 것으로 변경합니다.

공통점이 있다고해서 반드시 현명하다는 의미는 아닙니다.

실제로, 어떤 곳에서는 (최악의 학문 분야를 언급하지 않을 것입니다) 다른 공식 가설 검정에 근거한 많은 공식적인 가설 검정이 실제로 가르쳐집니다.

이를 수행하는 데있어 문제점은 프로 시저에 공칭 특성이없고 때로는 가깝지 않다는 것입니다. (반면, 극단적 인 위반에 대해 전혀 고려하지 않고 그런 것을 가정하면 훨씬 더 나빠질 수 있습니다.)

여러 논문은이 분산의 경우 분산이 검정과 동일하지 않고 거부에 대해 무언가를 수행하는 것처럼 단순히 행동하는 것이 좋습니다.

정상적인 경우에는 덜 명확합니다. 적어도 큰 표본에서, 비정규 성이 심각하지 않은 한, 대부분의 경우, 정규성은 그다지 중요하지 않습니다 (그러나 큰 표본의 경우 정규성 검정이 기각 될 가능성이 훨씬 높습니다). 한 가지 예외는 예측 간격에 대한 것인데, 실제로 분포 가정이 오른쪽에 가까워 야합니다.

부분적으로 한 가지 문제는 가설 검정이 답을 구해야하는 것과 다른 질문에 답한다는 것입니다. 당신은 실제로 '데이터가 정말로 정상적'이라는 것을 알 필요가 없습니다 (거의 항상, 선험적 으로 정확하게 정상적이지는 않습니다 ). 문제는 오히려 '비정규 성의 정도가 내 추론에 얼마나 나쁜 영향을 미칠 것인가'입니다.

두 번째 문제는 일반적으로 샘플 크기와 거의 무관하거나 실제로 샘플 크기를 늘리면 더 좋아 지지만 가설 검정은 거의 항상 큰 샘플 크기에서 기각됩니다.

견고하거나 심지어 분배가없는 절차가 정상 에서조차도 매우 효율적에 가깝고 ( 아마도 아주 약간의 출발에서 훨씬 더 효율적일 수있는) 많은 상황이 있습니다. 같은 신중한 접근.


Nice (+1) 이분산성 사건에 대해 언급 한 기사를 참조 할 수 있습니까?
gui11aume

2
나는 지적하고 싶지 않지만, 항상 온라인에서 그것들을 가로 질러 다니기 때문에 어느 것이 그것을 강조하는 경향이 있는지 알아내는 것은 어렵지 않습니다 (역사적으로 가설 검정을 강조하는 것과 같은 경향이 있습니다). 포스터는 그들이 생각 여기에 질문을 생성하는 사람들이 실제로 분야 일반적으로 같은 사람이 될 것입니다 공식적인 테스트를 사용할 수 있습니다. 그것은 단지 하나 또는 두 개의 학문이 아닙니다. 많은 것을 보았습니다. 그러나 일부는 특히 자주하는 것 같습니다. 그것이 합리적으로 일반적이기 때문에, 나는 그것을 주장한 영역에 특히 잘 알려진 텍스트가 있다고 가정 할 수 있습니다.
Glen_b-복지 주 모니카

1
@ gui11aume 여기에 참조가 있습니다 ... 그것은 내가 찾던 것 중 하나가 아니지만, 내가 얻고있는 요점을 만듭니다 (예비 테스트는 상황을 악화시킬 수 있음).
Glen_b-복지 주 모니카

2
Andrew Gelman은 최근 관련 그룹 간의 이질성 에 대해 관련 게시물을 가지고있었습니다 (적어도 이러한 프로세스가 문제가되는 이유).
Andy W

1
: 잠시 뒤로에서 이러한 논의에 관련된 질문 stats.stackexchange.com/questions/305/...
russellpierce

8

주요 문제는 다른 사람들이 잘 설명했지만 기본 또는 관련 문제와 혼동됩니다

  1. 통계에서 최대 한 종류의 증거인 P- 값에 대한 과다.

  2. 통계 보고서가 필연적으로 증거에 기반한 선택, 이전 분석, 직관, 추측, 판단, 이론 등의 혼합에 기반한 선택의 조합을 기반으로한다는 것을 꺼려합니다.

나와 신중한 친구 인 Test Everything이 모두 응답을 위해 로그 변환을 선택했다고 가정하지만, 물리적 인 추론과 데이터에 대한 이전 경험을 바탕으로 결론에 도달하는 반면 Test Everything은 Box-Cox 테스트 및 추정을 기반으로 로그 스케일을 선택합니다. 매개 변수의

이제 우리는 동일한 다중 회귀를 사용합니다. P- 값이 다른 해석을 가지고 있습니까? 한 가지 해석으로 Test Everything의 P- 값은 이전 추론에 조건이 있습니다. 나는 추론도 사용했지만 이전 프로젝트의 긴 일련의 이전 그래프, 계산 등을 기반으로 대부분 비공식적이었습니다. 어떻게보고해야합니까?

당연히 회귀 결과는 Test Everything과 나에게 동일합니다.

합리적인 조언과 모호한 철학의 동일한 조합이 예측 자와 기능적 형태의 선택에 적용됩니다. 예를 들어, 경제학자들은 이전의 이론적 논의를 존중하고 각 경우에 정당한 이유가있는 데이터 스누핑에주의하는 법을 널리 배웁니다. 그러나 가장 약한 경우, 관련 이론은 이전에 문헌에서 제시된 잠정적 인 제안 일 뿐이며, 일부 경험적 분석 후 가능성이 높습니다. 그러나 문헌 참고 문헌은 성화되어 있지만, 많은 저자들에게는 데이터를 통해 배우는 것이 용의자입니다.


매우 명확합니다 (+1).
gui11aume

1
+1. 그러나 분석 성능과 테스트 모든 분석의 성능에는 장기적인 차이가 있습니다. 이 분석을 실행할 때마다 문헌에 기록 된 내용 (실험에 따라 실험이 변동되지 않음)에 따라 동일한 전략을 사용합니다. OTOH, 데이터 무작위 샘플이며 Box-Cox 테스트의 결과는 연구에 따라 연구에 변동이 있습니다.
gung-Monica Monica 복원

말도 안되지만 내 경험도 장기적으로 바뀝니다.
Nick Cox
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.