귀무 가설은 어느 것입니까? 과학 이론, 논리 및 통계 사이의 충돌?


20

귀무 가설 을 설정하는 데있어 기본 논리를 이해하는 데 어려움이 있습니다. 이 답변 에서 명백하게 일반적으로 받아 들여지는 제안은 귀무 가설이 효과가 없을 것이라는 가설이며, 모든 것이 동일하게 유지됩니다.

대체 가설은 예를 들어 새로운 약물이 약속을 이행한다는 것을 증명하려는 것입니다.

이제 우리는 제안을 위조 할 수 있다는 것을 우리가 알고있는 형태의 과학 이론과 일반적인 논리를 알게되었습니다. 그렇기 때문에 우리는 귀무 가설을 반증하려고 시도하는데, 이는 대체 가설을 입증하는 것과 동등하지 않습니다. 그리고 이것은 회의론이 시작되는 곳입니다.

커튼 뒤에 어떤 종류의 동물이 있는지 알고 싶습니다. 불행히도 나는 동물을 직접 관찰 할 수는 없지만이 동물의 다리 수를 알려주는 검사를 받았습니다. 이제 다음과 같은 논리적 추론이 있습니다.

동물이 개라면 4 개의 다리가 있습니다.

테스트를 수행하고 4 개의 다리가 있음을 알면 이것이 개라는 증거 가 아닙니다 (말, 코뿔소 또는 다른 4 발 동물 일 수 있음). 그러나 4 다리 가 없다는 것을 알게 되면 개가 될 수 없다는 확실한 증거입니다 (건강한 동물을 가정).

약물 효과로 번역 커튼 뒤의 약물이 효과적인지 알고 싶습니다. 내가 얻을 수있는 유일한 것은 나에게 효과를주는 숫자입니다. 효과가 긍정적이면 아무 것도 증명되지 않습니다 (4 개의 다리). 효과가 없으면 약물의 효과를 반증합니다.

이 모든 것을 말하면-일반적인 지혜와는 달리-유효한 귀무 가설은

약물이 효과적입니다 (즉, 약물이 효과적이면 효과가 나타납니다).

이것이 내가 반증 할 수있는 유일한 이유이기 때문입니다. 다음 라운드에서 좀 더 구체적으로 노력하려고합니다. 따라서 효과를 나타내는 것은 귀무 가설이며 대립 가설은 기본값입니다 ( 효과 없음 ).

통계 테스트가 거꾸로하는 것 같은 이유는 무엇입니까?

추신 : 당신은 그래서 당신은 유효한 해당하는 가설을 얻기 위해 위의 가설을 부정 할 수 없다 "약물은 말을 하지 당신이 볼 수없는 경우에만 논리적으로 동등한 형태"가 될 것입니다 때문에 귀무 가설로 효과적인 " 아무 효과를 약물이됩니다 하지 수 "이제 결론은 당신이 찾고자하는 것이기 때문입니다.

PPS : 지금까지 답을 읽은 후 설명하기 위해 : 과학적 이론을 받아들이면, 허위 진술 만 할 수 있지만 그 사실을 입증 할 수 없다는 논리적 인 일관성이있는 유일한 것은 귀무 가설을 새로운 이론으로 선택하는 것입니다. 위조. 현상 유지를 위조하면 빈손으로 남게되므로 (현 상태는 반증되지만 새로운 이론은 입증되지 않습니다!). 그리고 당신이 그것을 위조하지 않으면 더 나은 위치에 있지 않습니다.


3
힌트 : "약물이 효과적입니다"는 과학적이거나 통계적인 진술로 충분히 정량화되지 않았습니다. 그것을 어떻게 정량적으로 만들 것입니까?
whuber

1
@ whuber : 이것은 내 문제 중 가장 적은 것입니다 : 예를 들어 혈액 보존이 10 % 줄어 들었습니다. 나는 이것이 귀무 가설이되어야한다고 주장한다 – 다른 가설은 "아무것도 일어나지 않는다"이다.
vonjd

9
반대로 이것은 이것이 문제 의 핵심 입니다. 통계에서 효과가 -10 %라는 null을 표시하는 것은 완벽합니다. 실험에 반대되는 증거가 충분히 있다면이를 거부 할 수 있습니다. 그러나 (특별한 계산 및 개념적인 가공을 제외하고) 실험 당 하나의 가설 만 검정 할 수 있습니다. 또한 효과 크기가 무엇인지 정확하게 알고 있지만 테스트해야 할 필요성을 느끼는 것은 드문 실험자입니다.
whuber

3
실제로 약물 시험에서 null은 일반적으로 "약이 현재 치료보다 효과적이지 않다"고 대안이 "약이 현재 치료보다 효과적입니다"로 해석됩니다. 그것은 우연히 내장 된 효과 크기를 가지고 있습니다. 이 제제를 사용 하면 약물의 효능에 대한 증거 가 null을 거부 할 수 있습니다. 가설을 바꾸었을 때, 효능에 대한 증거는 단지 그 약물이 좋다는 주장을 거부하지 못하게합니다. 첫 번째 경우 증거의 부담은 훨씬 더 엄격합니다.
whuber

1
@vonjd : 당신은 "만약 당신이 현 상태를 위조하면 당신은 빈손으로 남습니다"라고 말합니다. 잘못된. 우리가 "개"/ "개가 아닌"질적 판단을하고 있다면, "개가 아닌"증거를 제공하는 것이 "개"에 대한 강력한 증거가 아니라는 것은 사실입니다. 그러나 이것은 사물의 정량화의 가치입니다. "0이 아님"의 증거를 제공하면 0이 아닌 다른 값에 대한 좋은 증거를 제공합니다. 좋은 효과와 나쁜 효과에 대해 동등한 증거를 제공하는 것이 우려되는 경우 단측 테스트를 사용하십시오.
russellpierce

답변:


12

통계에는 동등성 검정과 Null에 대한 일반적인 검정이 있으며 이에 대한 충분한 증거가 있는지 결정합니다. 동등성 검정은 이것을 머리로 돌리고 효과가 널과 다른지 확인하고이 널에 대해 충분한 증거가 있는지 판별합니다.

나는 당신의 약물 사례에 대해 명확하지 않습니다. 응답이 효과의 값 / 표시 인 경우 효과 0은 효과가 없음을 나타냅니다. 이를 널 (Null)로 설정하고 이에 대한 증거를 평가합니다. 효과가 0과 충분히 다르면 비 효과 가설이 데이터와 일치하지 않는다는 결론을 내릴 수 있습니다. 양측 테스트는 Null에 대한 증거로 충분히 부정적인 효과 값을 계산합니다. 한쪽 테일 테스트는 그 효과가 긍정적 이고 0 충분히 다른 테스트이며 더 흥미로운 테스트 일 수 있습니다.

효과가 0인지 테스트하려면 H0이 효과가 0이 아닌 동등성 테스트를 사용해야합니다. H1 = 효과 = 0입니다. 효과가 0과 다르다는 아이디어에 대한 증거를 평가합니다.


9
여기서 문제의 일부는 IIRC, 우리가 Null로 no-effect를 선택하는 이유는 해당 효과의 매개 변수가 알려져 있기 때문입니다 0. 이 설정을 바꾸고 Null로 0이 아닌 영향을 미치려면 전체 모집단에 대해이 모수의 값이 무엇인지, 그리고 모수에 대한 모수의 값을 알고 있다면 미리 알아야합니다. 테스트에는 아무런 의미가 없습니다.
복원 모니카-G. 심슨

글쎄, 우리는 대립 가설과 같은 문제를 겪을 것 같습니다 (우리는 매개 변수를 모릅니다). 그래서 내 질문은 : 왜 둘 다 바꾸지 않습니까? 이것은 논리적으로 더 일관성있는 것 같습니다.
vonjd

다른 사람들이 동등성 테스트에 대해 언급하도록하겠습니다. 그것들은 표준 테스트에서 가설을 바꾸는 것과 같지 않지만 나는 그 아이디어에 익숙하지 않습니다. 나는 동등성 테스트가 내가 언급에서 언급 한 문제로 어려움을 겪고 있다고 생각하지 않습니다. 그것들은 매우 다른 이론적 관점에서 공식화되었습니다.
복원 Monica Monica-G. Simpson

5

나는 이것이 빈번한 통계가 실제로 묻고 싶은 질문에 직접적인 답을 줄 수 없기 때문에 미묘하게 다른 질문에 대답하지 않으며, 이것을 직접 답으로 잘못 해석하기 쉽다고 생각합니다. 실제로 질문하고 싶은 질문.

우리가 실제로 묻고 싶은 것은 대체 가설이 참일 확률 (또는 아마도 귀무 가설보다 참일 가능성이 얼마나 큰가)입니다. 그러나 잦은 주의자에 대한 확률은 장기 빈도이며,이 경우 우리는 장기적인 빈도가없는 특정 가설의 진실에 관심이있다. 사실이거나 그렇지 않습니다. 반면 베이지안은 이 질문에 직접 대답 할 수 있습니다. 베이지안의 경우 확률은 일부 제안의 타당성의 척도이므로 베이지안 분석에서는 특정 가설의 진실에 확률을 할당하는 것이 완벽하게 합리적입니다.

잦은 주의자들이 특정 사건을 다루는 방법은 사건을 일부 (가상 가상의) 모집단의 표본으로 취급하고 특정 표본에 대한 진술 대신 해당 집단에 대해 진술하는 것입니다. 예를 들어, 특정 동전이 편향 될 확률을 알고 싶다면 N 플립을 관찰하고 h 머리와 꼬리를 관찰 한 후에도 빈번한 분석은 해당 질문에 대답 할 수 없지만 동전의 분포에서 동전의 비율을 알 수 있습니다 N 번 뒤집었을 때 h 이상의 머리를주는 편견없는 동전. 우리가 일상 생활에서 사용할 확률에 대한 자연적인 정의는 일반적으로 빈번한 것이 아니라 베이지안이기 때문에 귀무 가설 (동전은 편견이 없음)이 될 가능성으로 이것을 취급하기가 너무 쉽습니다.

본질적으로 빈번한 가정 테스트는 암시 적 주관 론적 베이지안 구성 요소가 그 중심에 숨어있다. 잦은 테스트는 귀무 가설 하에서 최소한 극단적으로 통계를 관찰 할 가능성을 알려줄 수 있지만, 그러한 근거에서 귀무 가설을 기각하는 결정은 전적으로 주관적이므로 그렇게 할 합리적인 요구 사항은 없습니다. Essentiall 경험에 따르면 p- 값이 충분히 작 으면 (임계 값이 주관적 일 경우) 널을 거부 할 수있는 근거가있는 것이 일반적입니다. 이것이 전통입니다. AFAICS 과학 철학이나 이론에 잘 맞지 않는 것은 본질적으로 휴리스틱입니다.

그렇다고해서 빈번한 가설 테스트가 우리의 연구가 반드시 거쳐야하는 장애물이된다는 것을 의미하는 것은 아닙니다. 이는 과학자들이 우리의 회의론을 유지하고 이론에 대한 열정으로 사라지지 않도록 도와줍니다. 따라서 내가 베이지안을 마음에두고있는 동안, 나는 여전히 빈번한 가설 검정을 정기적으로 사용합니다 (적어도 저널 리뷰어가 베이지안 대안에 익숙 할 때까지).


3

Gavin의 답변에 추가하기 위해 몇 가지 사항 :

첫째, 제안을 위조 할 수는 있지만 입증 된 적이 없다는 생각을 들었습니다. 여기에 우리의 표현으로 잘 견디지 못하는 것처럼 보이기 때문에 이것에 대한 토론에 대한 링크를 게시 할 수 있습니까? X가 제안이라면, (X)도 제안이 아닙니다. 제안을 반박 할 수 있다면 X를 반박하는 것은 (X)를 증명하지 않는 것과 동일하며, 우리는 제안을 입증했습니다.

이자형에스+

약물은 효과가있다 (예 : IFF에 약물이 효과가 당신이 효과를 볼 것).

이자형에스+이자형에스+H0 . 그러나 효과적인 약물은 긍정적 인 테스트를 보장하지 않습니다. 약물이 효과적이고 분산이 높을 때 효과가 테스트에서 가려 질 수 있습니다.

이자형에스+H0이자형에스+H0

따라서 개 사례와 효과 사례의 차이는 증거에서 결론까지의 추론의 적절성에있다. 개의 경우 개를 강력하게 암시하지 않는 몇 가지 증거를 관찰했습니다. 그러나 임상 시험의 경우 효능을 강하게 암시하는 몇 가지 증거가 관찰되었습니다.


1
고맙습니다. 문장을 위조 할 수 있지만이를 입증 할 수는 없지만 (2 초에 링크) 논리적으로 일관된 유일한 것은 귀무 가설을 새로운 이론으로 선택하는 것입니다. 현상 유지를 위조하면 빈손으로 남게됩니다 (현 상태는 반증되지만 새로운 이론은 증명되지 않습니다!). 이제 링크의 좋은 출발점은 다음과 같습니다. en.wikipedia.org/wiki/Falsifiability
vonjd

2
여기서 언급 할 점은 귀무 가설을 증명하거나 반증하지 않는다는 것입니다. (고전적으로) 내린 결정은 귀무 가설을 유지하거나 거부하는 것입니다. 귀무 가설을 기각 할 때이를 반증하지 않습니다. 관찰 된 데이터가 주어지면 귀무 가설이 거의 없을 것입니다.
russellpierce

@ drknexus : 글쎄, 이것이 논리의 위조와 같은 확률 적이라는 것에 동의하지 않습니까?
vonjd

4
@drknexus "관측 된 데이터가 주어지면 귀무 가설이 가능하지 않다"고 말하는 것이 아니라 "귀무 가설이 참이면이 데이터는 가능하지 않다"고 말하는 것이 더 정확하지 않습니까? 통계적 가설 검정에서이 두 가지 고전적인 실수를 혼란시키지 않습니까?
Michael McGowan

1
MM : 맞습니다. 나는 내 말투가 조잡 해졌다.
russellpierce

3

어떤 의미에서, 빈번한 가정 테스트는 거꾸로 할 수 있습니다. 나는 그 접근법이 잘못되었다고 말하는 것이 아니라 그 결과가 종종 연구원이 가장 관심있는 질문에 답하도록 설계되지 않았다는 것입니다. 과학적 방법과 더 유사한 기술을 원한다면 베이지안 추론을 시도하십시오 .

베이지안 추론에서는 현재 상황에 대한 이해를 바탕으로 사전 확률 분포로 시작합니다. 새로운 증거를 획득 할 때 베이지안 추론은 고려 된 증거로 믿음을 업데이트 할 수있는 틀을 제공합니다. 이것이 과학이 작동하는 방식과 더 유사하다고 생각합니다.


3

나는 여기에 근본적인 오류가 있다고 생각합니다 (가설 ​​테스트의 전체 영역이 분명하지는 않습니다!) 그러나 대안은 우리가 증명하려고하는 것이라고 말합니다. 그러나 이것은 옳지 않습니다. 우리는 널을 거부하려고한다. 만약 널이 참이라면 우리가 얻는 결과가 매우 드물다면, 우리는 널을 거부합니다.

이제 다른 사람들이 말했듯이 이것은 일반적으로 우리가 묻고 싶은 질문이 아닙니다. 우리는 일반적으로 null이 참이면 결과가 얼마나 가능성이 있는지 상관하지 않으며 결과가 주어지면 null이 얼마나 될지 신경 쓰지 않습니다.



2

@Doc의 Paul Meehl에 대한 언급을 확장하겠습니다.

1) 귀무 가설이 만들어 내기 때문에 연구 가설의 반대를 테스트하면 "공식적으로 유효하지 않은"인수 인 결과 만 확인할 수 있습니다. 결론은 반드시 전제를 따르지는 않습니다.

If Bill Gates owns Fort Knox, then he is rich.
Bill Gates is rich.
Therefore, Bill Gates owns Fort Knox.

http://rationalwiki.org/wiki/Affirming_the_consequent

이론이 "이 약물은 회복을 향상시킬 것"이고 회복이 개선되었다는 것이 이론이 사실이라고 말할 수있는 것은 아닙니다. 다른 이유로 개선 된 복구가 발생할 수 있습니다. 두 그룹의 환자 또는 동물은 기준선에서 정확히 동일하지 않으며 연구 기간 동안 시간이 지남에 따라 더 변할 것입니다. 무작위 배정은 기준선에서 알려지지 않은 혼란 요소의 심각한 불균형에 대해 "방어"하기 ​​때문에 실험 연구보다 관찰에 더 큰 문제이다. 그러나 무작위 화는 실제로 문제를 해결하지 않습니다. 혼란이 알려지지 않은 경우 우리는 "무작위 방어"가 어느 정도 성공했는지 알 수있는 방법이 없습니다.

또한 표 14.1과 왜 자체적으로 이론을 테스트 할 수 없는지에 대한 논의를 참조하십시오.

폴 미엘 LL Harlow, SA Mulaik 및 JH Steiger (Eds.)에서 "문제는 통계학이 아닌 인식론 : 신뢰 구간으로 유의성 테스트를 대체하고 위험한 수치 예측의 정확도를 정량화합니다"라는 의미가 있습니다. (pp. 393–425) 뉴저지 주 Mahwah : Erlbaum, 1997.

2) 어떤 유형의 편향이 도입되면 (예 : 일부 혼란스러운 요소에 대한 불균형)이 편향이 어느 방향으로 놓여 있는지 또는 얼마나 강한 지 알 수 없습니다. 우리가 줄 수있는 가장 좋은 추측은 치료 그룹이 회복률이 높은 방향으로 편향 될 가능성이 50 %라는 것입니다. 표본 크기가 커짐에 따라 유의성 검정에서이 차이를 탐지하고 이론을 뒷받침하는 것으로 데이터를 해석 할 확률도 50 %입니다.

이 상황은 "이 약물은 회복율을 x % 향상시킬 것"이라는 귀무 가설의 경우와 완전히 다릅니다. 이 경우 편견이 존재하면 (동물과 인간 그룹을 비교할 때 항상 존재한다고 말하면) 이론을 거부 할 가능성이 높아집니다.

가능한 가장 극단적 인 측정으로 인해 가능한 결과의 "공간"(Meehl은 "Spielraum"이라고 함)을 생각하십시오. 아마도 0-100 %의 복구가있을 수 있으며 1 %의 해상도로 측정 할 수 있습니다. 일반적인 유의성 검정 사례에서 이론과 일치하는 공간은 관찰 할 수있는 가능한 결과의 99 %가됩니다. 특정 차이를 예측하는 경우 이론과 일치하는 공간이 가능한 결과의 1 %가됩니다.

그것을 넣는 또 다른 방법은 mean1 = mean2의 귀무 가설에 대한 증거를 찾는 것이 약물이 무언가를 수행한다는 연구 가설에 대한 심각한 테스트아니라는 것입니다. mean1 <mean2의 널 (null)이 더 좋지만 여전히 그리 좋지는 않습니다.

여기에서 그림 3과 4를 참조하십시오 : (1990). 이론 평가 및 수정 : Lakatosian 방어 전략과이를 사용하는 두 가지 원칙 . 심리적 문의, 1, 108-141, 173-180


0

모든 통계가 자연계에서는 확실하지 않다는 가정을 전제로하지는 않습니다 (인공 게임 세계와 구별됨). 다시 말해, 우리가 그것을 이해하기 위해 접근 할 수있는 유일한 방법은 한 가지가 다른 것과 연관 될 확률을 측정하는 것입니다. 이것은 0과 1 사이에서 변하지 만 가설을 무한한 횟수로 테스트 할 수 있다면 1 일 수 있습니다 무한한 수의 서로 다른 상황은 물론 불가능합니다. 우리는 같은 이유로 그것이 0이라는 것을 결코 알 수 없습니다. 그것은 절대론을 다루고 주로 방정식에 의존하는 수학보다 자연의 현실을 이해하는 데보다 신뢰할 수있는 접근법입니다. 말 그대로 방정식의 LH 측 = 실제로 RH 측, 양측 우리는 아무 것도 배울 수 없었습니다. 엄밀히 말하면 그것은 본질적으로 격동적인 '자연적인'세상이 아닌 정적 세계에만 적용됩니다. 따라서 귀무 가설은 자연 자체를 이해하는 데 사용될 때마다 수학을 덮어 써야합니다.


0

문제는 '참'이라는 단어에 있다고 생각합니다. 자연계의 현실은 시간이 지남에 따라 무한히 복잡하고 변하기 때문에 자연적으로 알 수 없으므로 자연에 적용되는 '진실'은 항상 조건부입니다. 우리가 할 수있는 모든 것은 반복 된 실험에 의해 변수들 사이의 가능한 대응 수준을 찾으려고 노력하는 것입니다. 현실을 이해하려는 시도에서, 우리는 그것의 질서처럼 보이는 것을 찾고, 우리가 현명한 결정을 내리는 데 도움이되도록 개념적으로 의식적인 모델을 생각합니다. 그러나 그것은 항상 치명적인 일입니다. 예기치 않은. 귀무 가설은 현실을 이해하려는 유일한 출발점입니다.


1
두 대답을 합쳐야한다고 생각합니다.
vonjd

-1

우리는 기각하려는 귀무 가설을 선택해야합니다.

가설 검정 시나리오에는 임계 영역이 있기 때문에 가설이있는 영역이 임계 영역에 도달하면 가설을 기각하고 그렇지 않으면 가설을 받아들입니다.

따라서 우리가 받아들이고 자하는 귀무 가설을 선택한다고 가정 해 봅시다. 귀무 가설 하의 영역은 임계 영역하에 있지 않으므로 귀무 가설을 받아 들일 것입니다. 그러나 여기서 문제는 귀무 가설 하의 영역이 수용 가능한 영역에 속한다고해서 대립 가설 하의 영역이 수용 가능 영역에 속하지 않는다는 의미는 아닙니다. 그리고 이것이 사실이라면 결과에 대한 우리의 해석은 잘못 될 것입니다. 따라서 우리는 그 가설을 우리가 거부하고자하는 귀무 가설로 받아 들여야합니다. 귀무 가설을 기각 할 수 있다면 대립 가설이 참이라는 것을 의미합니다. 그러나 귀무 가설을 기각 할 수없는 경우 두 가설 중 하나가 정확할 수 있습니다. 우리가 다른 가설을 귀무 가설로 삼을 수있는 또 다른 테스트를 할 수 있습니다. 우리는 그것을 거부하려고 시도 할 수 있습니다. 대립 가설 (이제 귀무 가설 임)을 기각 할 수 있다면 초기 귀무 가설이 참이라고 말할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.