신뢰 구간과 가설 검정의 차이점은 무엇입니까?


28

가설 테스트 를 사용해서는 안된다고 제안하는 일부 주석가들과 함께 가설 테스트관련된 논쟁에 대해 읽었습니다 . 일부 의견자는 신뢰 구간 을 대신 사용해야한다고 제안합니다 .

  • 신뢰 구간과 가설 검정의 차이점은 무엇입니까? 참조 및 예를 가진 설명이 이해 될 것이다.

5
p- 값 수준에서 무언가를 확인하거나 거부하는 것보다 신뢰 구간을 표시 하여 가설 검정 결과보고하는 것이 왜 더 좋은지 묻고 싶었습니다 .

3
답변 된 다른 질문 중 일부를 확인하는 것이 좋습니다.
Andy W

답변:


19

가설 검정에 신뢰 구간 (CI)을 사용할 수 있습니다. 일반적으로 효과의 CI가 0에 해당하지 않으면 귀무 가설을 기각 할 수 있습니다. 그러나 CI를 더 많이 사용할 수 있지만 통과 여부를보고하는 것이 테스트의 유용성의 한계입니다.

예를 들어 t- 검정 대신 CI를 사용하도록 권장하는 이유는 단순한 가설 검정 이외의 작업을 수행 할 수 있기 때문입니다. 효과가있을 것으로 생각되는 효과 범위 (CI의 효과)에 대해 설명 할 수 있습니다. t- 검정만으로는 그렇게 할 수 없습니다. 또한 t-test로는 할 수없는 null에 대해 설명 할 수 있습니다. t-test가 null을 거부하지 않으면 null을 거부 할 수 없다고 말하면됩니다. 그러나 널 주변의 신뢰 구간이 좁 으면 널 또는 그에 가까운 값이 실제 값일 수 있으며 처리 또는 독립 변수의 영향이 너무 작아 의미가 없음을 제안 할 수 있습니다 ( 또는 실험이

나중에 추가 : 실제로 CI를 테스트처럼 사용할 수는 있지만 실제로는 그렇지 않다고 말했습니다. 모수 값이 있다고 생각되는 범위의 추정치입니다. 당신은 추론처럼 테스트를 할 수 있지만 그렇게 말하는 것에 대해 이야기하지 않는 것이 훨씬 좋습니다.

어떤게 더 좋아?

A) 효과는 0.6, t (29) = 2.8, p <0.05입니다. 이 통계적으로 유의 한 영향은 ... (A Neyman - 피어슨 프레임 워크에서의 또는 발견의 크기의 실제 의미를 논의하기에도 강한 능력에 대한 언급없이이 통계적 유의성에 대한 몇 가지 토론 계속된다 ...의 크기 tp 값은 거의 의미가 없으며, 효과가 존재하는지 여부를 알 수없는 것만으로도 논의 할 수 있습니다. 실제로 테스트를 기반으로 한 효과가 없다고 말할 수는 없습니다.)

또는

B) 95 % 신뢰 구간을 사용하여 효과가 0.2와 1.0 사이 인 것으로 추정합니다. (일부 토론은 그럴듯한 가치가 특정한 의미를 가지고 있고 그것이 의미하는 바에 정확히 의미가있는 단어를 사용하는 것이 그럴듯한 가치인지의 여부에 대한 실제 관심 효과에 대해 이야기합니다. 또한 CI의 폭은 이것이 강력한 결과인지 또는 더 잠정적 인 결론에 도달 할 수 있는지에 대한 토론)

기본 통계 수업을 수강 한 경우 처음에는 A를 사용하게됩니다. 결과를보고하는 것이 더 좋은 방법이있을 수 있습니다. 그러나 대부분의 작업에서 B는 훨씬 우수합니다. 범위 추정치는 테스트가 아닙니다.


@john의 의견에 대한 한 가지 추가 사항 : 첫째, 때로는 중요한 질문은 CI가 0이 아닌 1에 걸쳐 있는지 여부입니다 (예 : 로지스틱 회귀).
Peter Flom-Monica Monica 복원

여러분, 1입니까 아니면 0입니까? (이것은 저에게 매우 밝게 보입니다. 그래서, 올바른 값을 찾아야한다고 생각합니다!)
@John

알파가 0.05 인 95 % CI와 양측 검정 가설의 관계는 무엇입니까? 그렇지 않다면 어떻게됩니까?
사랑 통계

love-stats는 동일하게 사용될 때 동일합니다.
John

Adhesh Josh, 귀무 가설은 미리 지정된 고정 값일 수 있습니다. 이것이 바로 NHST에 대한 CI의 또 다른 특징입니다. 0 이외의 가상 값에 대해 테스트하려는 경우 사용이 매우 쉽습니다.
John

7

가설 검정과 신뢰 구간 간에는 등가가 있습니다. (예를 들어 http://en.wikipedia.org/wiki/Confidence_interval#Statistical_hypothesis_testing 참조 ) 매우 구체적인 예를 들겠습니다. 평균 및 분산 1 을 갖는 정규 분포에서 표본 이 있다고 가정 하고 합니다. 이라고 가정 하고 귀무 가설 레벨에서 테스트한다고 가정따라서 검정 통계량을 만듭니다.이 경우 표본 평균이됩니다 : . 이제x1,x2,,xnμN(μ,1)μ=mH0:μ=m0.05.v=(x1+x2++xn)/nA(m)이 테스트의 대한 "허용 영역"입니다 . 이는 이 의 가능한 값의 집합 임을 의미합니다 여기서 귀무 가설 은 0.05 수준에서 허용됩니다. 귀무 가설이 참이라고 결론 내릴 것입니다.). 이 예에서는 정규 분포를보고이 분포에서 확률이 0.95 이상인 집합을 선택할 수 있습니다. 이제 대한 95 % 신뢰 영역 모든 집합이다 되는 되어 . 즉, 그것은 모든 의 집합입니다vA(m)vμ=mN(m,1)μmvA(m)m관측 된 대해 귀무 가설이 채택됩니다 . 그렇기 때문에 John은 "효과의 CI가 하지 않으면 귀무 가설을 기각 할 수 있습니다."라고 말합니다. (John은 테스트의 경우를 말합니다 .)v0μ=0

관련 주제는 p- 값입니다. p- 값은 귀무 가설을 기각하는 검정의 최소 수준입니다. 신뢰 구간에 대한 논의와 연계하기 위해 특정 표본 평균 구하고 크기가 다른 신뢰 구간을 구성 한다고 가정 합니다. 대한 95 % 신뢰 구간에 포함되지 않았다고 가정하십시오 . 그런 다음 에서 귀무 가설 을 기각 할 수 있습니다 그런 다음 값에 닿을 때까지 신뢰 구간을 늘리고 (포함하지는 않음) 신뢰 구간이 98 %라고 가정합니다. 그러면 가설 대한 p- 값 은 입니다.vμmμ=m0.05.mμ=m0.0210.98 ).


p- 값은 널을 거부하기위한 최소 레벨의 테스트로 해석 될 수 없으므로이 값을 읽으십시오. "단일 (또는 진행중인) 실험에서 p 값을 해석하는 것은 Neyman-Pearson 가설 검정 컨텍스트에서 허용되지 않는 것으로 나타났습니다. ap 값의 계산은 귀무 가설의 진실에만 의존합니다. p 값은 측정하지 않습니다. HA를 뒷받침하는 증거의 양; HO에 대한 귀납적 증거의 척도입니다. " '출처 : ftp.stat.duke.edu/WorkingPapers/03-26.pdf
sree22

@ sree22 당신은 이것에 대해 확장하거나 rewording을 제안 할 수 있습니까? 나는이 맥락에서 해석이 아닌 p- 값의 정의를 주려고했습니다.
DavidR

3

'학생'은 어떤 효과가 더 중요하고 어떤 효과가 더 중요한지를 보여줄 수 있다는 근거로 신뢰 구간을 주장했다.

예를 들어, 첫 번째 효과가 £ 5에서 £ 6 사이의 재정적 영향에 대한 신뢰 구간을 갖는 반면 두 번째 효과는 £ 200에서 £ 2800 사이의 신뢰 구간을 갖는 두 가지 효과를 발견 한 경우입니다. 첫 번째는 통계적으로 더 중요하지만 두 번째는 아마도 더 중요합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.