귀무 가설을 증명할 수 있습니까?


37

질문에서 알 수 있듯이-귀무 가설을 증명할 수 있습니까? 가설에 대한 (제한된) 이해에서 대답은 '아니오'이지만 나는 그것에 대한 엄격한 설명을 할 수 없습니다. 질문에 확실한 답이 있습니까?


4
"증명하다"는 말의 의미에 따라 다릅니다. 언급 한 바와 같이 이것은 통계적인 질문이 아니라 철학적 인 질문이며 결정적인 답은 없습니다 (최소한 David Hume 이후로 대부분의 사람들은 "아니오"라고 대답합니다).
whuber

이것은 다소 잘못된 질문입니다. 우리는이 "증거"가 발생하는 조건을 알아야합니다.
chanceislogic

아마도 더 나은 제기 된 질문은 "어떤 조건 / 가정에서 귀무 가설을 증명할 수 있는가?"입니다.
chanceislogic

답변:


19

공식 논리가 아닌 실제 세계에 대해 이야기하고 있다면 대답은 물론입니다. 경험적 수단에 의한 어떤 것의 "증명"은 사람이 만들 수있는 추론의 강도에 달려 있으며, 차례로 세계가 어떻게 작동하는지 (즉, 이론)에 대해 아는 모든 것의 관점에서 평가 된 테스트 과정의 유효성에 의해 결정됩니다. 어떤 경험적 결과가 "널 (null)"가설을 기각한다는 정당성을 인정할 때마다 반드시 이런 종류의 판단 (디자인의 타당성, 세계는 특정 방식으로 작동 함)을 판단하므로 " null "은 전혀 문제 가 되지 않습니다 .

그렇다면 유사한 가정은 무엇입니까? 다음은 건강 과학 및 사회 과학에서 흔한 "널 (null) 증명"의 예입니다. (1) 실질적으로 의미있는 방식으로 "널"또는 "효과 없음"을 정의하십시오. 두 가지 치료법, t1과 t2 사이에 의미있는 차이가없는 것처럼 하나는 다른 것보다 3 % 더 나은 회복 가능성을 제공하지 않는 한, 스스로 행동해야한다고 생각합시다. (2) t1과 t2 사이에 회복 가능성의 차이가 있는지 여부에 영향을 미치는지 여부를 테스트하기위한 유효한 설계를 알아냅니다. (3) 충분히 높은 가능성을 생성하기 위해 어떤 표본 크기가 필요한지 결정하기 위해 검정력 분석을 수행하십시오.존재 한다고 가정 합니다. 일반적으로 사람들은 특정 알파에서 특정 효과를 관찰 할 가능성이 0.80 이상인 경우 검정력이 충분하다고 말하지만 올바른 신뢰 수준은 실제로 p를 선택할 때와 마찬가지로 실수를 어떻게 회피해야 하는가에 달려 있습니다. "null 거부"에 대한-값 임계 값. (4) 경험적 테스트를 수행하고 효과를 관찰합니다. 이 예제에서 지정된 "의미있는 차이"값 (예 : 3 %) 아래 인 경우 "효과 없음"이 있음을 "증명"했습니다.

이 문제를 잘 처리하려면 Streiner, DL Unicorns Do Exist : Null Hypothesis의“증명”에 대한 자습서를 참조하십시오 . Canadian Journal of Psychiatry 48, 756-761 (2003).


1
+1. 이것은 "증거"의 표준에 대해 명확하게하는 것의 중요성에 대한 좋은 예입니다. 많은 응용 프로그램에서 여기에서 호출하는 응용 프로그램은 "있는 것처럼 행동"표준이라고 부를 수 있습니다. 나는 그 유용성을 부정하지 않으며 합리적인 의사 결정을 지원하기 위해 이런 종류의 접근을 옹호합니다. (그러나 아마도 베이지안 방법이 더 낫습니다 ... :-)
whuber

1
(+1) 좋은 대답입니다. Streiner의 온라인 기사에 대한 링크를 추가했습니다. 나는 당신이 신경 쓰지 않기를 바랍니다 (제거 자유롭게).
chl

1
몇 가지 더 : (1) 널을 지지 하는 증거로 널을 거부하지 못하는 것을 처리 하는 것은 Streiner의 주장에 있어 충격적인 흔한 오류이자 일반적인 경우입니다. 이 실수는 본질적으로 "p <0.05"표준의 유형 1 오류로의 강력한 혐오를 유형 2로 만드는 라이센스로 바꿉니다. S는 "기다려야합니다-힘이 필요합니다 ..." H의 PT 마찬가지로 교정의로 널 거부하는 경험적 증거의 파괴 실제로 널을. H는 인덕션이 인과 추론을 지원할 수 없다고 말합니다. 승인; 그러나 경험적 연구를위한 대안은 없습니다! 인과 관계없이 ume (Hume)이 아닌 진주 (& Bayes)로 가십시오!
dmk38

1
동등성 테스트에 대한이 질문에는 stats.stackexchange.com/questions/3038/…에
Jeromy Anglim

이것은 "널 (null)이 아닌"을 새로운 귀무 가설로 가정하고이 새로운 귀무 가설을 기각하는 것과 같은 것입니까?

16

수학적 측면에서 답 : "가설이 서로 특이한 경우"가 가능합니다.

"증명하다"는 말에 "수락"할 수있는 규칙이 있다는 것을 의미하는 경우 (내가 말해야 할 것 :)) 은 실수가 0 일 확률이 있으며 "이상적 테스트"라고 할 수있는 것을 찾는 것입니다. 존재한다 :H0

당신이 임의의 변수 어떠했는지를 테스트하는 경우 에서 그려진 P 0 또는에서 P 1 (즉, 테스트 H 0 : X P 0H 1 : X P 1 ) 다음이 존재 이상적인 테스트 경우에만, P 1P 0 ( P 1P 0 은 "상호 특이 적"임). 엑스01H0:엑스0H1:엑스1 1010

"상호 단수"의 의미를 모르는 경우 U [ 3 , 4 ] ( [ 0 , 1 ][ 3 , 4 ]의 균일)는 서로 특이합니다 . 테스트하려는 경우[0,1][,4][0,1][,4]

H 1 : X U [ 3 , 4 ]H0:엑스[0,1]H1:엑스[,4]

그런 다음 이상적인 테스트가 존재합니다 (그것이 무엇인지 추측합니다) : 결코 잘못된 테스트가 아닙니다!

만약 P 0 이 서로 특이 적이 지 않다면, 이것은 존재하지 않습니다 (이것은 "만일 경우에만"결과입니다)!10

비 수학적인 측면에서 와 증거 당신의 가정에 이미있는 경우에만 (즉, 당신이 가설 선택한 경우만 경우 널을 입증 할 수있는이 수단 H 1 에서 하나의 관찰 그래서 다른 H 0 하나로서 identifyed 수없는 H 1 및 바이스 반대). H0H1H0H1


4
+1 좋은 답변. 수학의 간단한 표현은 널 (null)과 그 대안이 불연속적인 결과 집합을 산출한다고 가정합니다. 예를 들어, 이 방에 얼룩말이 있거나없는 것입니다. 물론 여기서 "증명"은 암시 적으로 "모델에 대한 조건부"를 포함하는데, 그 자체는 수학적 정리와 같은 엄격함을 가지고 결코 확립되지 않습니다. 여기에는 "관측의 정확성에 대한 조건부"가 내재적으로 포함됩니다. 가설은 모호하지 않게 해석 될 수 있음을 암시 적으로 포함합니다. (후자에 대한 비판은 George Lakoff의 여성, 화재 및 위험한 것들을 참조하십시오 . )
whuber

11

예, 확실한 대답이 있습니다. 그 답은 다음과 같습니다. 아니요, 귀무 가설을 증명할 방법이 없습니다. 내가 아는 한 최선을 다하는 것은 추정 주위에 신뢰 구간을 던지고 효과가 너무 작아서 본질적으로 존재하지 않을 수도 있음을 증명하는 것입니다.


4
보다 일반적으로 통계의 문제는 귀무 가설을 증명할 수 없다는 것이 아니라 점을 확실하게 추정 할 수 없다는 것입니다. 즉, "변수의 효과가 없다"고 말할 수없는 것처럼 "변수의 효과 크기는 1.95"라고 말할 수 없습니다. 통계에는 항상 신뢰 구간이 있습니다.
russellpierce

1
통계적 가설을 세워서 대답은 큰 NO이며 매우 강력한 이유에 동의했습니다. 받아 들여진 대답이 달리 주장하고 있다는 사실은 절대적으로 비극적입니다. 답으로 가설 검정이 제공하는 것은 다음과 같습니다. 가설이 참이라고 가정하면 샘플링 한 데이터가 일치합니까? 그리고 결코 다른 방법은 아닙니다. 가설이 참인지 아닌지를 추론 할 수 없다는 것을 이해하는 데는 많은 추론이 필요하지 않습니다.
Christophe

4

저에게있어 이론 프레임 워크 결정은 "널 가설"을 이해하는 가장 쉬운 방법을 제시합니다. 그것은 기본적으로 적어도 두 가지 대안, 즉 귀무 가설과 하나 이상의 대안이 있어야한다고 말합니다. 그런 다음 "결정 문제"는 대안 중 하나를 수용하고 다른 대안을 거부하는 것입니다 (가설을 "수락"하고 "거부"하여 의미하는 바에 대해 정확해야 함). 나는 "우리는 귀무 가설을 증명할 수 있는가?"라는 질문을 봅니다. "우리는 항상 올바른 결정을 내릴 수 있습니까?"와 유사합니다. 의사 결정 이론 관점에서 대답은 분명히 그렇습니다

1) 의사 결정 과정에 불확실성이 없기 때문에 올바른 결정이 무엇인지 알아내는 것이 수학적 연습이다.

2) 우리는 문제의 다른 모든 전제 / 가정을 받아들입니다. 가장 중요한 것은 (우리가 결정하는 가설은 철저하고, 그 중 하나만 사실이어야하고, 다른 하나는 거짓이어야한다는 것입니다.)

보다 철학적 인 관점에서, "증거"는 전적으로 "증거"로 이어지는 가정 / 공리에 의존한다는 의미에서 아무것도 "증명"할 수 없습니다. 나는 증거가 틀렸다면 그 사실을 초래 한 가정들도 ​​틀렸다는 의미에서 증거를 "사실"또는 "진실"이라기보다는 일종의 논리적 동등성으로 본다.

이것을 "무 가설 증명"에 적용하면 나는 그것이 참이라고 가정하거나 특정 조건이 충족되면 (예 : 통계 값) 참이라고 가정함으로써 참임을 증명할 수 있습니다.


3

예, 널에 대한 대안을 증명할 수있는 것과 정확히 동일한 의미에서 널을 증명할 수 있습니다. 베이지안 분석에서, 널에 찬성하는 확률과 제안 된 대안 중 임의의 것이 될 가능성은 완벽하게 가능합니다. 또한, 위의 답변 중 일부가 주장하는 것처럼, 대안이 분리되어있는 경우에만 null을 증명할 수 있다고 주장하는 것은 거짓입니다 (null과 겹치지 마십시오). 베이지안 분석에서 모든 가설은 사전 확률 분포를 갖습니다. 이 분포는 제안 된 대안에 비해 사전 확률의 단위 질량을 분산시킵니다. 귀무 가설은 모든 이전 확률을 단일 대안으로 제시합니다. 원칙적으로, 널에 대한 대안은 이전의 모든 확률을 널이 아닌 대안 (다른 "지점")에 둘 수있다. 그러나 이것은 드물다. 일반적으로 대안 헤지, 즉 대안 대안을 제외하거나보다 일반적으로 널 대안을 포함하여 다른 대안에 대해 동일한 질량의 사전 확률을 분산시킵니다. 그러면 어떤 가설이 실험 데이터가 실제로 떨어질지를 가장 먼저 예측하게됩니다. 데이터가 널 (null)이 떨어 뜨려야하는 위치에 단단히 떨어지면, 제안 된 가설 중에서도 IT 대안 (IT와 대체로 배타적이지 않아야 함)에 포함되어 있어도 승률이 유리합니다. 중첩 된 대안이 중첩 된 집합보다 확률이 높을 가능성은 없다고 생각하면 확률과 가능성을 구별하지 못합니다. 집합의 구성 요소가 전체 집합보다 확률이 낮을 수는 없지만, 가설 집합의 구성 요소에 대한 사후 가능성이 집합의 전체 가능성보다 클 수 있습니다. 가설의 사후 가능성은 가설이 위치하는 우도 함수와 사전 확률 분포의 곱입니다. 가설이 모든 사전 확률을 올바른 위치 (예 : 널)에 두는 경우, 사전 확률의 일부를 잘못된 위치 (널이 아님)에 놓는 가설보다 사후 확률이 높습니다. 가설의 사후 가능성은 가설이 위치하는 우도 함수와 사전 확률 분포의 곱입니다. 가설이 모든 사전 확률을 올바른 위치 (예 : 널)에 두는 경우, 사전 확률의 일부를 잘못된 위치 (널이 아님)에 놓는 가설보다 사후 확률이 높습니다. 가설의 사후 가능성은 가설이 위치하는 우도 함수와 사전 확률 분포의 곱입니다. 가설이 모든 사전 확률을 올바른 위치 (예 : 널)에 두는 경우, 사전 확률의 일부를 잘못된 위치 (널이 아님)에 놓는 가설보다 사후 확률이 높습니다.


2

기술적으로, 귀무 가설은 입증 될 수 없습니다. 고정 된 유한 샘플 크기의 경우 통계 테스트에 거의 아무런 힘이없는 작지만 0이 아닌 효과 크기가 항상 있습니다. 그러나 실제로는 귀무 가설의 일부 엡실론 내에 있음을 증명할 수 있으므로이 엡실론보다 작은 편차는 실제로 중요하지 않습니다.


2

증거가 가능한 경우가 있습니다. 학교가 있고 귀무 가설이 남학생과 여학생의 수가 같다고 가정 해 봅시다. 표본 크기가 증가함에 따라 남학생 대 여학생 비율의 불확실성이 감소하는 경향이 있으며 전체 동공 모집단이 표본 추출 될 때 확실성에 도달합니다 (증거라고 생각합니다).

그러나 유한 모집단이 없거나 대체 표본 추출을 통해 재 표본 표본을 발견 할 수없는 경우 유한 표본 표본으로 불확실성을 0으로 줄일 수는 없습니다.


0

여기서는 많은 사용자가 다소 혼란스러워하는 점에 대해 이야기하고 싶습니다. 귀무 가설 H0 : p = 0의 실제 의미는 무엇입니까? 매개 변수 p가 0인지 확인하려고합니까? 물론 그러한 목표를 달성 할 수있는 방법은 없습니다.

우리가 설정하려는 것은 데이터 세트가 주어지면 평가 된 매개 변수 값이 0과 구별 할 수 없다는 것입니다. NHST는 대안 가설에 대해 "불공평하다"는 점을 기억하십시오. null은 95 % 신뢰 수준이며 대안에 대해서는 5 %입니다. 결과적으로 "유의하지 않은"결과는 H0가 보유한다는 것을 의미하는 것이 아니라 대안이 가능할 것이라는 충분한 증거를 찾지 못했다는 것을 의미합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.