그래서 다른 결과를 바탕으로 한 통계 테스트를 선택하는 것은 좋지 않다고 들었습니다. 그래도 나에게는 이상해 보인다. 예를 들어, 다른 테스트에서 잔차가 정규 분포를 따르지 않는다고 제안 할 때 비모수 적 테스트를 사용하는 경우가 종종 있습니다. 이 접근법은 꽤 널리 받아 들여져 있지만이 단락의 첫 번째 문장에 동의하지 않는 것 같습니다. 나는이 문제에 대해 명확히하기를 바랐습니다.
그래서 다른 결과를 바탕으로 한 통계 테스트를 선택하는 것은 좋지 않다고 들었습니다. 그래도 나에게는 이상해 보인다. 예를 들어, 다른 테스트에서 잔차가 정규 분포를 따르지 않는다고 제안 할 때 비모수 적 테스트를 사용하는 경우가 종종 있습니다. 이 접근법은 꽤 널리 받아 들여져 있지만이 단락의 첫 번째 문장에 동의하지 않는 것 같습니다. 나는이 문제에 대해 명확히하기를 바랐습니다.
답변:
점을 감안 데이터를이 극단적 인 경우, 또는 더 극단적 인 관찰의 확률 사실은, 다음의 해석 무엇 생산하는 시험의 선택에서 만든 파견 결정이 있었다 과정을 통해 도착됩니다 그 ? 답은 알 수 없습니다 (또는 적어도 거의 알 수 없습니다). 다른 확률 론적 프로세스를 기반으로 테스트 실행 여부를 결정함으로써 결과의 해석을 더욱 복잡하게 만들 수 있습니다. H 0 p p p p p표본 크기 및 분석 계획이 사전에 완전히 선택되면 값을 최대한 해석 할 수 있습니다. 다른 상황에서는 해석이 어려워 지므로 '좋은 생각이 아닙니다'. 즉, 널리 채택 된 관행입니다 ... 결국 실행하려는 테스트가 유효하지 않다는 것을 알게되면 왜 테스트를 실행해야합니까? 그 질문에 대한 답은 확실하지 않습니다. 이것은 모두 귀무 가설 유의성 검정 ( 의 주요 사용 사례 )이 극복하기 어려운 몇 가지 문제가 있다는 단순한 사실로 요약됩니다 .
예를 들어, 다른 테스트에서 잔차가 정규 분포를 따르지 않는다고 제안 할 때 비모수 적 테스트를 사용하는 경우가 종종 있습니다. 이 접근법은 꽤 널리 받아 들여져 있지만이 단락의 첫 번째 문장에 동의하지 않는 것 같습니다. 나는이 문제에 대해 명확히하기를 바랐습니다.
그렇습니다. 많은 사람들이 이런 종류의 일을하고 두 번째 검정을 등분 산 등을 거부 할 때 이분산성을 다룰 수있는 것으로 변경합니다.
공통점이 있다고해서 반드시 현명하다는 의미는 아닙니다.
실제로, 어떤 곳에서는 (최악의 학문 분야를 언급하지 않을 것입니다) 다른 공식 가설 검정에 근거한 많은 공식적인 가설 검정이 실제로 가르쳐집니다.
이를 수행하는 데있어 문제점은 프로 시저에 공칭 특성이없고 때로는 가깝지 않다는 것입니다. (반면, 극단적 인 위반에 대해 전혀 고려하지 않고 그런 것을 가정하면 훨씬 더 나빠질 수 있습니다.)
여러 논문은이 분산의 경우 분산이 검정과 동일하지 않고 거부에 대해 무언가를 수행하는 것처럼 단순히 행동하는 것이 좋습니다.
정상적인 경우에는 덜 명확합니다. 적어도 큰 표본에서, 비정규 성이 심각하지 않은 한, 대부분의 경우, 정규성은 그다지 중요하지 않습니다 (그러나 큰 표본의 경우 정규성 검정이 기각 될 가능성이 훨씬 높습니다). 한 가지 예외는 예측 간격에 대한 것인데, 실제로 분포 가정이 오른쪽에 가까워 야합니다.
부분적으로 한 가지 문제는 가설 검정이 답을 구해야하는 것과 다른 질문에 답한다는 것입니다. 당신은 실제로 '데이터가 정말로 정상적'이라는 것을 알 필요가 없습니다 (거의 항상, 선험적 으로 정확하게 정상적이지는 않습니다 ). 문제는 오히려 '비정규 성의 정도가 내 추론에 얼마나 나쁜 영향을 미칠 것인가'입니다.
두 번째 문제는 일반적으로 샘플 크기와 거의 무관하거나 실제로 샘플 크기를 늘리면 더 좋아 지지만 가설 검정은 거의 항상 큰 샘플 크기에서 기각됩니다.
견고하거나 심지어 분배가없는 절차가 정상 에서조차도 매우 효율적에 가깝고 ( 아마도 아주 약간의 출발에서 훨씬 더 효율적일 수있는) 많은 상황이 있습니다. 같은 신중한 접근.
주요 문제는 다른 사람들이 잘 설명했지만 기본 또는 관련 문제와 혼동됩니다
통계에서 최대 한 종류의 증거인 P- 값에 대한 과다.
통계 보고서가 필연적으로 증거에 기반한 선택, 이전 분석, 직관, 추측, 판단, 이론 등의 혼합에 기반한 선택의 조합을 기반으로한다는 것을 꺼려합니다.
나와 신중한 친구 인 Test Everything이 모두 응답을 위해 로그 변환을 선택했다고 가정하지만, 물리적 인 추론과 데이터에 대한 이전 경험을 바탕으로 결론에 도달하는 반면 Test Everything은 Box-Cox 테스트 및 추정을 기반으로 로그 스케일을 선택합니다. 매개 변수의
이제 우리는 동일한 다중 회귀를 사용합니다. P- 값이 다른 해석을 가지고 있습니까? 한 가지 해석으로 Test Everything의 P- 값은 이전 추론에 조건이 있습니다. 나는 추론도 사용했지만 이전 프로젝트의 긴 일련의 이전 그래프, 계산 등을 기반으로 대부분 비공식적이었습니다. 어떻게보고해야합니까?
당연히 회귀 결과는 Test Everything과 나에게 동일합니다.
합리적인 조언과 모호한 철학의 동일한 조합이 예측 자와 기능적 형태의 선택에 적용됩니다. 예를 들어, 경제학자들은 이전의 이론적 논의를 존중하고 각 경우에 정당한 이유가있는 데이터 스누핑에주의하는 법을 널리 배웁니다. 그러나 가장 약한 경우, 관련 이론은 이전에 문헌에서 제시된 잠정적 인 제안 일 뿐이며, 일부 경험적 분석 후 가능성이 높습니다. 그러나 문헌 참고 문헌은 성화되어 있지만, 많은 저자들에게는 데이터를 통해 배우는 것이 용의자입니다.