대체 가설이 필요한 이유는 무엇입니까?


14

테스트 할 때 두 가지 결과가 나옵니다.

1) 귀무 가설을 기각한다

2) 귀무 가설을 기각하지 않습니다.

우리는 다른 가설을 받아들이는 것에 대해 이야기하지 않습니다. 대립 가설 수용에 대해 이야기하지 않으면 왜 대립 가설이 필요합니까?

여기에 업데이트가 있습니다 : 누군가 나에게 두 가지 예를 줄 수 있습니까?

1) 귀무 가설을 기각하는 것은 대립 가설을 수용하는 것과 같습니다.

2) 귀무 가설을 기각하는 것은 대립 가설을 받아들이는 것과 같지 않습니다.


1
당신이 있기 때문에 노력하고 몇 가지 결론을 도출 할 수 있습니다. 귀무 가설이 아니면 귀무 가설을 기각 할 경우 대립 가설이 유효한지 확실하지 않더라도 대립 가설 일 수 있습니다. 귀무 가설을 기각하면 대립 가설이 참일 수 있다는 결론을 내릴 수있는 "증거"가 있다고합니다.
nbro

@nbro, 감사합니다. 원래 게시물에 질문을 추가했습니다. 좀 봐 줄래?
user1700890

1
나는 일반적으로 가설 검정에 익숙하지 않다. 유능한 사람이 귀하의 질문에 대답 할 때까지 기다리는 것이 좋습니다.
nbro

대립 가설이 귀무 가설을 보완하는 경우 전혀 사용할 필요가 없습니다. 이러한 이유로 교과서 외부에서 대체 가설을 실제로 사용하는 사람은 없습니다.
Aksakal

"우리는 다른 가설을 받아들이는 것에 대해 이야기하지 않습니다."-가능한 모든 "우리"에게 해당되는 것은 아닙니다. 어떤 사람들은 대립 가설을 받아들이는 것에 대해 이야기하고 다른 사람들 은 금기를 말하는 것에 대해 금기를 존중하더라도 그것을 생각 합니다. 대체 가설을 받아들이는 것에 대해 이야기하는 것을 피하는 것이 다소 타당합니다. 그러나 통계가 오용되기 쉽기 때문에이 경우 페 도리는 결과 해석에주의를 기울이는 한 좋은 것일 수 있습니다.
John Coleman

답변:


8

"대안 가설 수용에 대해 이야기하지 않으면 왜 대체 가설이 필요합니까?"에 중점을 둘 것입니다.

의미있는 테스트 통계를 선택하고 연구 결과를 설계하여 대안이 참일 때 null을 기각 할 가능성이 높습니다. 대안이 없다면 우리는 힘의 개념이 없습니다.

우리는 귀무 가설 만 있고 대안이 없다고 상상해보십시오. 그런 다음 검정력이 높은 검정 통계량을 선택하는 방법에 대한 지침은 없습니다. 우리가 말할 수있는 것은 "값이 널 미만일 가능성이없는 테스트 통계량을 관찰 할 때마다 널을 거부합니다." 임의의 것을 선택할 수 있습니다 : Uniform (0,1) 난수를 그리고 0.05 미만일 때 null을 거부 할 수 있습니다. 이것은 널의 "드물게"에서 발생하며 시간의 5 %를 넘지 않습니다. 그러나 널이 거짓 일 때도 드물게 발생합니다. 따라서 이것은 기술적으로 통계적인 테스트이지만 다른 증거 나 반대 증거로는 의미가 없습니다.

대신, 일반적으로 우리가 어떤 과학적으로 그럴듯한 대안 가설을 가지고 ( "이 있습니다 내 실험에서 실험군과 대조군 사이의 성과에 긍정적 인 변화가"). 우리는 악마의 옹호자로서 귀무 가설을 제기 할 잠재적 비평가들로부터 그것을 방어하고 싶습니다. ( "아직 확신하지 못합니다 .- 당신의 치료가 실제로 상처를 입히거나 전혀 효과없을 수도 있습니다 . 데이터는 샘플링 변동 때문입니다 ").

이 2 가지 가설을 염두에두고, 대안 의 전형적인 값이 널 (null)이 아닐 가능성이 있는 검정 통계량을 선택하여 강력한 검정을 설정할 수 있습니다 . (대안이 참이면 0에서 멀리 떨어진 양의 2- 표본 t- 통계량은 놀랍지 않지만 널이 참이면 놀랍습니다.) 그런 다음 null 아래에서 검정 통계량의 샘플링 분포를 파악하여 p- 값을 계산할 수 있습니다 --- 그리고 그것들을 해석하십시오. 특히 연구 설계, 표본 크기 등이 높은 검정력을 갖도록 선택된 경우에는 거의 없을 수있는 검정 통계량을 관찰 하면 대안에 대한 몇 가지 증거가 제공 됩니다.

그렇다면 대체 가설을 "수락"하는 것에 대해 왜 이야기 하지 않습니까? 강력한 연구조차도 널이 잘못되었다는 철저한 증거 를 제공하지 않기 때문 입니다. 여전히 일종의 증거이지만 다른 종류의 증거보다 약합니다.


7

역사적으로 대안 가설이 필요한지에 대한 의견이 일치하지 않았다. 잦은 통계의 맥락 내에서 Fisher와 Neyman의 의견과 베이지안 답변을 고려하여이 불일치 점을 설명하겠습니다.

  • Fisher- 우리는 다른 가설이 필요하지 않습니다. 적합도 검정을 사용하여 귀무 가설을 간단히 검정 할 수 있습니다. 결과는 귀무 가설에 대한 증거 측정 값을 제공 하는 값입니다.p

  • Neyman- 우리는 널과 대안 사이에 가설 테스트를 수행해야합니다. 테스트는 고정 된 사전 지정된 속도 로 type-1 오류가 발생하도록합니다 . 결과는 수준에서 귀무 가설을 기각할지 기각할지 결정하는 것 입니다.αα

    우리는 결정 이론적 관점에서 대안이 필요하다 – 우리는 두 가지 행동 과정 중에서 선택하고있다-그리고 우리는 시험의 힘을보고해야하기 때문에 대안이 사실 일 때 을 기각 할 수있는 가장 강력한 테스트를 찾아야 합니다.

    1p(Accept H0|H1)
    H0

    이 두 가지 점을 모두 만족시키기 위해 대체 가설은 ' 아님 ' 모호 할 수 없습니다 .H0

  • 베이지안 -우리는 적어도 두 가지 모델을 고려하고 데이터로 상대적인 타당성을 업데이트해야합니다. 단일 모델 만 있으면 어떤 데이터를 수집하더라도 됩니다. 이 프레임 워크에서 계산하기 위해 대체 가설 (또는이 컨텍스트에서 알려진 모델)이 잘못 정의 된 ' 아님'이 될 수 없습니다 . 모델을 작성할 수 없기 때문에 잘못 정의했습니다 .

    p(H0)=1
    H0p(data|not H0)


1
당신의 마지막 요점은 훌륭하고 종종 동기가 부여되지 않은 단일 NHST에 대한 전체 주장을 근거로 한 출판물에서는 무시됩니다.
Konrad Rudolph

' '이 잘못 정의 된 이유는 무엇 입니까? H0
Michael

무엇입니까? 를 계산할 수 있습니까 ? p(data|notH0)
innisfree

@innisfree는 빈번한 개념하에 있지는 않지만 아마도 베이지안에서는 가능합니다.
Michael

적어도 2 개의 모델을 소개하지 않고 시도해보십시오.
innisfree

4

필자는이 공식적인 요구하지만, 일반적으로인지하는 경우 100 % 아니다 가설과 대안 철저한 1) 보완 및 2) : 가설이다. 즉, 1) 둘 다 동시에 사실 일 수는 없습니다. 2) 하나가 사실이 아닌 경우 다른 하나는 사실이어야합니다.

소녀와 소년 사이의 간단한 키 테스트를 고려하십시오. 이 경우 일반적인 귀무 가설은 입니다. 다른 가설은 입니다. 따라서 널이 참이 아니면 대안이 참이어야합니다.heightboys=heightgirlsheightboysheightgirls


1
나는 당신의 진술에 전적으로 동의하지만, 과 는 일반적으로 무한히 큰 귀무 가설 세트입니다. 또한 많은 것을 확신 것으로 보인다 및 참조 예를 들어, 철저한 할 필요는 없으나 토론을. H0HaH0Ha
bi_scholar

2
토론 스레드 주셔서 감사합니다. 나는 이것에 대한 전문가는 아니지만 간단한 추론을 바탕으로 그들이 철저해야한다고 생각합니다. 이 이상한 시험을 생각해보십시오. 누군가가 길에서 5 개의 암석을 순서대로 배열 한 것을 발견합니다. 그의 : 바람이 이것을했습니다. 그의 : 외계인이었습니다. 이제 바람이 이것을 할 확률을 테스트하고 0.0001의 확률을 찾으면 바람 가설을 기각합니다. 그러나 외계인이라고 주장 할 권리는 없습니다. 그가 주장 할 수있는 것은 그것이 바람 일 가능성이 적다는 것입니다. 그러나 다른 어떤 설명도 열려 있습니다. H0H1
Karolis Koncevičius

1
나는 동의한다. 내 추론은 를 거부하거나 수락하면서 가설 테스트가 을 수락 또는 거부 하는 것에 입니다. 경우 및 철저하지, 어떤 정의 의미가 없습니다 전혀 우리가 거부 할 경우에도 이후, 우리가 받아 들일 수 없다 외부의 다른 가설이 존재하는 한, 및 또한 사실 일 수 있습니다. 불행히도 첫 번째 스레드에서 내 요점을 파악하지 못했습니다. H a H 0 H a H a H 0 H a H 0 H aH0HaH0HaHaH0HaH0Ha
bi_scholar

1
@innisfree one은 어떤 가능성 프레임 워크에서 2 점 가설을 검정 할 수 있습니다. 그러나 그 절차를 "무 가설 검정"이라고하는 것은 아니며 정확하지 않습니다. 그들 중 어느 것도 진실이 아닌 경우에도 가장 가까운 것을 선택합니다. 또한 검정력-시험의 검정력을 계산할 때 대체 가설 또는 효과 크기를 선택할 수 있지만 일단 테스트가 끝나면 잊어 버려야합니다. 데이터에 나타날 수있는 영향에 대해 알려주는 사전 정보가없는 한. 시끄러운 사진의 흰색 / 검정색 픽셀처럼
Karolis Koncevičius

1
@innisfree 나는 그러한 테스트가 어떻게 생겼는지 궁금합니다. 작은 예를 만들 수 있습니까? 및 에 해당하는 이 아니라면 을 거부하여 을 수락 할 수 없다고 확신합니다 . H 0 θ { 0 , 1 } H 0 H 1θ=1H0θ{0,1}H0H1
bi_scholar

2

왜 대체 가설이 필요합니까?

고전 가설 검정에서 대립 가설이 수행하는 유일한 수학적 역할은 선택한 검정 통계량을 통해 증거의 순서에 영향을 미친다는 것입니다. 대립 가설은 검정에 대한 적절한 검정 통계량을 결정하는 데 사용되는데, 이는 귀무 가설에 가장 도움이되는 것 (설명 된 대안에 대한)에서 귀무 가설에 가장 덜 도움이되는 것까지 가능한 모든 데이터 결과 의 순서 순위 를 설정하는 것과 같습니다. (명시된 대안에 대한). 가능한 데이터 결과의 순서 순위를 정한 후 대립 가설은 검정에서 더 이상의 수학적 역할을하지 않습니다 .


nx=(x1,...,xn)T:RnR데이터의 가능한 모든 결과를 귀무 가설 또는 대립 가설에 더 도움이되는지를 측정하는 서수 척도로 매핑합니다. (일반성을 잃지 않으면 우리는 더 낮은 값이 귀무 가설에 더 도움이되고 더 높은 값이 대립 가설에 더 도움이된다고 가정 할 것입니다. 우리는 때때로 테스트 통계의 더 높은 값이 더 극단적 인 구성이라면 "더 극단적"이라고 말합니다 대립 가설에 대한 증거) 시험p- 값 은 다음과 같이 주어진다.

p(x)pT(x)P(T(X)T(x)|H0).

이 p- 값 함수는 데이터 벡터에 대한 검정의 증거를 완전히 결정합니다. 선택한 유의 수준과 결합하면 모든 데이터 벡터에 대한 검정 결과가 결정됩니다. (우리는 고정 된 수의 데이터 포인트 대해 설명 했지만 임의의 을 허용하도록 쉽게 확장 할 수 있습니다 .) p- 값은 유도하는 서수 스케일을 통해서만 테스트 통계의 영향을 받는다는 점에 유의해야합니다.nn따라서 검정 통계량에 단조 증가하는 변환을 적용해도 가설 검정과 차이가 없습니다 (즉, 동일한 검정). 이 수학적 특성은 테스트 통계의 유일한 목적이 모든 가능한 데이터 벡터의 공간에 서수 스케일을 유도하여 널 / 대체에 더 도움이되는 것을 나타내는 것입니다.

대립 가설은 함수 통해서만T 이 측정에 영향을 미치며 , 이는 전체 모델 내에서 명시된 귀무 및 대립 가설을 기반으로 선택됩니다. 따라서 검정 통계량 함수를 전체 모형 의 함수 및 두 가설 로 간주 할 수 있습니다 . 예를 들어, 우도 비 검정의 경우 검정 통계량은 귀무 가설 및 대립 가설과 관련된 모수 범위에서 우도 함수의 우도 비율 (또는 비율의 로그)을 취하여 구성됩니다.Tg(M,H0,HA)M


테스트를 다른 대안과 비교하면 이것이 무엇을 의미합니까? 고정 된 모델 있고 두 개의 다른 대안 및 에 대해 동일한 귀무 가설 비교하는 두 개의 다른 가설 검정을 수행하려고 한다고 가정하십시오 . 이 경우 두 가지 다른 테스트 통계 함수가 있습니다.MH0HAHA

T=g(M,H0,HA)T=g(M,H0,HA),

해당 p- 값 함수로 연결 :

p(x)=P(T(X)T(x)|H0)p(x)=P(T(X)T(x)|H0).

이 경우에주의하는 것이 중요하다 및 다음 P 값 함수 서로 단조 증가 변환되어 와 를 모두 검사가 동일한 테스트 그래서, 동일하다. 함수 와 가 서로 단조 증가하는 변환이 아닌 경우 두 가지 다른 가설 검정이 있습니다.TTppTT


2
나는 테스트가 극단적 인 결과에 직면했을 때 귀무 가설을 기각하도록 설계하고, 대립 가설의 역할은 귀무 가설이 사실이라면 결과는 극단적으로 간주 될 수있는 지점이다라고 말하는이 동의 것
헨리

1

대안 가설을 받아들이지 않을 것이라고 생각하는 이유는 그것이 우리가 테스트하는 것이 아니기 때문입니다. 귀무 가설 유의성 검정 (NHST)은 귀무 가설이 참인 경우 데이터가 관측 된 것 이상으로 극단적으로 관측 될 확률을 계산하거나, 즉 NHST는 귀무 가설이 참이라는 사실에 따라 결정되는 확률 값을 계산합니다. , . 따라서 귀무 가설이 참이라고 가정 할 때 데이터의 확률입니다. 절대 가설의 가능성을 사용하거나 제공하지 않습니다 (널 또는 대안 모두 아님). 따라서 작은 p- 값을 관찰하면 관찰 한 데이터가 못할 가능성이 있다는 알면됩니다.P(data|H0)H0따라서 널에 대한 증거를 수집하고 대안 설명에 유리합니다.

실험을 실행하기 전에 중요하다고 생각되는 차단 수준 ( )을 결정할 수 있습니다 . 즉, p- 값이 해당 수준 아래로 떨어지면 null에 대한 증거가 너무 높아서 데이터는 다른 데이터 생성 프로세스에서 비롯된 것이어야하며 해당 증거를 기반으로 귀무 가설을 기각합니다. p- 값이 해당 수준보다 높으면 표본이 다른 데이터 생성 프로세스를 형성했다고 믿을만한 증거가 충분하지 않기 때문에 귀무 가설을 기각 할 수 없습니다.α

대체 가설을 공식화하는 이유는 샘플링을 시작하기 전에 실험을 염두에 두었 기 때문입니다. 대립 가설을 공식화하면 단측 또는 양측 검정을 사용할지 여부를 결정할 수 있으므로 단측 시나리오에서 더 많은 통계적 검정력을 제공 할 수 있습니다. 그러나 기술적으로 테스트를 실행하려면 대체 가설을 공식화 할 필요가 없으며 데이터 만 있으면됩니다.


NHST는 계산하지 않습니다 . 그것은 계산 . 구별이 중요합니다. P(data|H0)P(data as extreme as that observed|H0)
innisfree 2018 년

@innisfree 나는 동의한다. 그리고 그것은 정확히 같은 문장에서 데이터를 정의한 방법이다.
Stefan

? 데이터가 정의 된 곳 (그 방식 또는 다른 방식)을 볼 수 없음
innisfree

그럴지라도 왜 그렇게합니까? 왜 그런 식으로 데이터를 재정의합니까? 나는 P 주변 텍스트의 부분 (데이터 .. 명확히 좋을 걸
이니스프리
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.