통계 학자들은 왜 귀무 가설을 받아들이는 것과 달리 의미없는 결과가 귀무를 거부 할 수 없다는 것을 의미한다고 말합니까?


44

두 개의 표본 t- 검정과 같은 전통적인 통계 검정은 두 개의 독립적 인 표본의 함수간에 차이가 없다는 가설을 제거하려고 노력합니다. 그런 다음 신뢰 수준을 선택하고 평균의 차이가 95 % 수준을 초과하면 귀무 가설을 기각 할 수 있다고 말합니다. 그렇지 않다면, "널 귀무 가설을 기각 할 수 없습니다". 이것은 우리도 그것을 받아 들일 수 없다는 것을 암시하는 것 같습니다. 귀무 가설이 참인지 확실하지 않다는 것을 의미합니까?

이제 두 가설의 함수가 동일하다는 가설이있는 검정을 설계하려고합니다 (가설이 두 표본이 다르다는 가설이있는 기존 통계 검정의 반대). 그래서 제 귀무 가설은 두 샘플이 다르다는 것입니다. 그러한 테스트를 어떻게 설계해야합니까? p- 값이 5 % 미만이면 큰 차이가 없다는 가설을 받아 들일 수 있다고 말하는 것만 큼 간단합니까?



평균의 차이가 95 % 수준을 초과하면 귀무 가설을 기각 할 수 있습니다. 95 %는 "수준"이 아니며 100 개 사례 (비교) 중 95 개 사례에 있으며, 표본 변동에 따라 표본 통계량의 차이가 발생합니다. 이는 알파 = .05에서 널이 허용됨을 의미합니다. 95 % 수준을 말하는 것은 올바른 용어가 아닙니다.
Subhash C. Davar

답변:


44

전통적으로 귀무 가설 은 포인트 값입니다. (일반적으로 이지만 실제로는 모든 포인트 값이 될 수 있습니다.) 다른 가설은 실제 값은 null 값 이외의 다른 값이라는 것 입니다. 연속 변수 (예 : 평균 차이)는 무기한 값과 거의 같지만 여전히 동일하지 않은 값을 취하여 귀무 가설을 거짓으로 만들 수 있기 때문에 기존의 귀무 가설을 입증 할 수 없습니다. 0

귀무 가설이 이고 관측 한 평균 차이가 0.01이라고 가정 합니다. 귀무 가설이 참이라고 가정하는 것이 합리적입니까? 당신은 아직 모른다; 신뢰 구간 이 어떻게 보이는지 아는 것이 도움이 될 것 입니다. 95 % 신뢰 구간은 ( 4.99 , 5.01 이지만 95 % CI는 ( 0.005 ,00.01 . 이제 실제 값이 0 이라고 결론 내릴까요? CI가 매우 넓고 합리적으로 의심 할만한 0이 아닌 많은 값이 데이터와 일치하기 때문에 편안하게 말할 수 없습니다. 이제 훨씬 더 많은 데이터를 수집하고 관측 된 평균 차이는 0.01 이라고 가정하겠습니다.(4.99, 5.01)00.01 입니다. 관측 된 평균 차이는 동일하게 유지되었지만 (실제로 발생하면 놀라 울 것입니다.) 신뢰 구간은 이제 널값을 제외합니다. 물론 이것은 생각 실험 일 뿐이지 만 기본 아이디어를 명확하게해야합니다. 우리는 진정한 가치가 특정 포인트 가치라는 것을 결코 증명할 수 없습니다. 우리는 그것이 어떤 포인트 가치라는 것을 (아마도) 반증 할 수 있습니다. 통계적 가설 검정에서 p- 값이> 0.05 (및 95 % CI에 0이 포함됨)는 귀무 가설이 참인지 확실하지 않다는것을 의미합니다.(0.005, 0.015)

구체적인 경우에 대해, 대안적인 가설이 평균 차이가 이고 귀무 가설이 0이 아닌 다른 테스트를 구성 할 수 없습니다 . 이는 가설 검정의 논리를 위반합니다. 그것이 실질적이고 과학적인 가설이라는 것은 합리적이지만 가설 검정 상황에서는 대체 가설이 될 수 없습니다. 0

그래서 당신은 무엇을 할 수 있습니까? 이 상황에서는 동등성 테스트를 사용합니다. ( 태그 를 클릭하여이 주제에 대한 일부 스레드를 읽을 수 있습니다 .) 일반적인 전략은 양면 테스트 방식을 사용하는 것입니다. 간단히 말해서, 실제 평균 차이가 0 일 수도있는 구간을 선택합니다.0당신이 신경 쓸 수있는 모든 것에 대해, 당신은 관찰 된 값이 그 구간의 상한보다 작은 지 여부를 결정하기 위해 단측 테스트를 수행하고, 그 값이 하한보다 큰지 확인하기위한 또 다른 단측 테스트를 수행합니다. 이 두 테스트가 모두 유의하면 실제 값이 관심 구간을 벗어났다는 가설을 기각 한 것입니다. 하나 (또는 ​​둘 다)가 중요하지 않은 경우 실제 값이 구간을 벗어났다는 가설을 기각 할 수 없습니다.

예를 들어 구간 내의 모든 것이 0에 너무 가까워서 목적에 따라 0과 같다고 생각한다고 가정하고이를 실질적인 가설로 사용하십시오. 이제 위에서 설명한 첫 번째 결과를 얻는다고 상상해보십시오. 비록 0.01(0.02, 0.02)0.01 내의 모든 것이 해당 구간 내에 속한다고 가정하면 한쪽 t- 검정에서 귀무 가설을 기각 할 수 없으므로 귀무 가설을 기각 할 수 없습니다. 반면에 위에서 설명한 두 번째 결과가 있다고 상상해보십시오. 이제 관찰 된 값이 지정된 간격 내에 있고 상한보다 작거나 하한보다 더 크게 표시 될 수 있으므로 널을 거부 할 수 있습니다. (그것은 당신이 거부 할 수 있음을 주목할 가치가 모두 진정한 가치가 있다는 가설 , 가설은 외부의 간격의 진정한 가치 거짓말 ( -0 처음에는 난처한 것처럼 보이지만 가설 검정의 논리와 완전히 일치합니다.) (0.02, 0.02)


1
"전통적으로, 귀무 가설은 포인트 값입니다."- 경우에 따라 귀무 가설을 마치 포인트 인 것처럼 쓰지만 실제로는 복합적 입니다. 첫 번째 단락의 주장이 일방적 인 테스트에 어떤 영향을 미치는지 궁금합니다. (내가 아는 한, 일방적 인 테스트에서도 " 수락 "을 쓰지 않기 때문에 첫 번째 단락이 " H 0 수락"을 쓰지 않는 진정한 이유를 확실하게 알 수 없습니다 .)H0H0
은어

1
@Silverfish, 단락은 "전통적인 귀무 가설을 입증 할 수 없습니다 "로 끝납니다 . 그러나 동일한 이유로 일방적 인 테스트에 대해 "accept "을 쓰지 않습니다 . 때 H 0 : δ 0 , 진정한 δ가 될 수 있습니다 > 0 ,하지만 임의적으로 가까운 및 따라서 비 중요. 실제로 그것이 < 0 임을 나타내 려면 단면 테스트의 방향을 뒤집을 수 있습니다. 여기서 문제가 보이지 않습니다. H0H0:δ0δ>0<0
gung-Monica Monica 복원

1
나는 당신이 쓴 것이 잘못되었다고 말하는 것이 아니며, 그것이 당신이 의사 소통하려는 아이디어라고 생각합니다. 분명히 답의 첫 두 단락에서 포인트 가설을 사용하여 양면 테스트를 수행 한 이유는 이것이 문제의 경우이기 때문입니다. 그러나 우리가 왜 일반적으로 " 받아들이지 않는지"궁금해하는 누군가가 당신의 대답을 다시 읽으면 , 당신의 주장이 실제로 귀무 가설을 넘어서 확장된다는 것이 명확하지 않을 수 있습니다. H0
실버 피쉬

4
"우리는 진정한 가치가 어떤 특정 가치라는 것을 증명할 수 없다; 우리는 그 가치가 어느 정도 가치가 있다는 것을 (아마도 반증 할 수있다") 논쟁은 CI의 특정 사례에 해당한다-CI가 (-0.015) , -0.005)? 우리가 어느 정도까지 "증명" (문자 그대로 수학적 의미에서 "증명"을 사용하지 않는다는 것을 알고 있습니다. "아마도"또는 "추천"은 의도 된 의미에 더 가깝습니다.) " 증명 된 " δ 0 이지만 여전히 우리는 H 0을 "수락 "하지 않습니다 :δ0δ0H0:δ0
은어

1
H0:δ<0H0:δ=0δ>0δ<0실제로 그들 중 하나를 받아 들일 수 있습니다 (또는 결정적이지 않은 결과). 또한 편측 테스트는 베이지안 관점에서 더 의미가 있습니다. 또한 과학적 예측에는 방향이 있어야합니다. 일방적 인 테스트가 충분하지 않다고 생각하기 시작합니다.
amoeba는 Reinstate Monica가

28

귀무 가설이 동전이 2가 향하고 있다는 것, 즉 머리가 1 일 확률이 1 인 경우를 생각해 보자. 이제 데이터는 동전을 한 번 뒤집고 머리를 본 결과이다. 그 결과 p- 값 1.0은 모든 합리적인 알파보다 큽니다. 이것은 동전이 2 방향이라는 것을 의미합니까? 그것은 가능할 수도 있지만 공정한 동전 일 수도 있으며 우연히 우연히 목격되었습니다 (공정한 동전으로 50 %의 시간이 걸릴 것입니다). 따라서이 경우 높은 p- 값은 관측 된 데이터가 null과 완벽하게 일치하지만 다른 가능성과도 일치한다고 말합니다.

법정에서 "무죄"판정은 피고가 결백하다는 것을 의미 할 수 있으며 피고는 유죄이지만 충분한 증거가 없기 때문일 수도 있습니다. 귀무 가설과 마찬가지로 귀무 가설이 기각 될 수 없기 때문에 기각하지 못하거나 허위 일지라도 기각 할 충분한 증거가 없을 수 있습니다.


3
나는 "무죄"사례를 좋아합니다. 한 걸음 더 나아가서 과거에 사용하는 방법을 몰랐고 일부 신념을 뒤집 었다는 DNA 증거에 근거한 사례를 다시 여는 것은 충분한 증거를 확보하는 데 필요한 더 많은 데이터를 추가하는 것의 완벽한 예입니다.
Thomas Speidel

7

증거의 부재는 부재의 증거가 아닙니다 (BMJ에 대한 Altman, Bland 논문의 제목). P- 값은 중요한 것으로 간주 될 때 결석에 대한 증거 만 제공합니다. 그렇지 않으면 그들은 아무 것도 말하지 않습니다. 따라서 증거가 없습니다. 다시 말해, 우리는 알지 못하고 더 많은 데이터가 도움이 될 수 있습니다.


5

H0

H1H0

H0

두 개의 표본이있는 경우 동일하게 분포 될 것으로 예상되면 귀무 가설은 표본이 동일하다는 것입니다. 우리가 (거의) 다를 것으로 예상되는 두 개의 표본이 있다면, 우리의 귀무 가설은 그것들이 다르다는 것입니다.


그리고 만약 우리가 기대가 없다면 어쩌면 우리가 모르는 것일 수도 있습니다. 또한 두 표본이 다르다는 가설을 기각하려는 경우 결정 규칙이 어떻게 작동합니까?
ryu576

두 가지 유형의 오류를 모두 작게 유지하려는 기대는 없지만 항상 가능한 것은 아닙니다. 이를 위해서는 추가 변수 (예 : 샘플 크기 늘리기)가 필요합니다.
SomeEE

2
우리는 널을 거부 할 수는 있지만 그것을 증명할 수 없기 때문에 널은 일반적으로 우리가 진실로 증명하거나 가정하고자하는 것과 반대입니다. 우리가 차이가 있다고 생각한다면, 널 (null)은 차이가 없어야합니다.
Greg Snow

@Greg 어느 쪽이 사실인지 알고 있다면 좋은 방법입니다. 아마도 일반적인 경우 일 것입니다.
SomeEE

1
"당신이 기대하는 것"과 "서로 다른 것"은 정량적이지 않기 때문에 통계적 가설이 될 수 없습니다 . 그것은 문제의 요점을 얻는다 : 귀무 가설과 대립 가설 사이의 역할 비대칭은 귀무 하에서 효과 크기로 분포를 매개 변수화 할 필요성과 비교하여 귀무 하에서 검정 통계량의 샘플링 분포를 결정하는 능력에서 비롯된다. 대립 가설. 우리가 "유형 I 오류를 최소화"하는 경우도 마찬가지입니다. 결코 발생 하지 않습니다 (최소값은 항상 0 임). 테스트 는 유형 I과 II 오류율 사이 의 균형을 찾습니다 .
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.