대규모 연구에서 귀무 가설을 기각하지 못하면 귀무에 대한 증거가 아닌가?


59

귀무 가설 유의성 검정의 기본 한계는 연구원이 귀무에 찬성하여 증거를 수집 할 수 없다는 것입니다 ( 출처 )

이 주장이 여러 곳에서 반복되는 것을 보았지만 이에 대한 정당성을 찾을 수 없습니다. 대규모 연구를 수행 하고 귀무 가설에 대한 통계적으로 유의미한 증거를 찾지 못하면 귀무 가설대한 증거 아닌가?


3
그러나 우리는 귀무 가설이 정확하다고 가정하여 분석을 시작합니다 ... 가정이 잘못되었을 수 있습니다. 어쩌면 우리는 충분한 힘이 없지만 가정이 옳다는 것을 의미하지는 않습니다.
SmallChess

13
읽지 않았다면 Jacob Cohen의 The Earth is Round (p <.05)를 강력히 추천 합니다. 그는 표본 크기가 충분히 크면 귀무 가설을 거의 기각 할 수 있다고 강조합니다. 또한 효과 크기와 신뢰 구간을 사용하는 것을 선호하며 베이지안 방법을 깔끔하게 보여줍니다. 또한, 읽는 것이 정말 기쁩니다!
Dominic Comtois

7
귀무 가설은 단지 잘못된 것일 수 있습니다 . ... null을 거부하지 못한다고해서 충분히 가까운 대안에 대한 증거는 아닙니다.
Glen_b

3
stats.stackexchange.com/questions/85903을 참조하십시오 . 그러나 stats.stackexchange.com/questions/125541 도 참조하십시오 . "대규모 연구"를 수행하여 "관심의 최소 효과를 탐지 할 수있을만큼 큰 힘"을 의미하는 경우 거부 실패 는 널을 승인하는 것으로 해석 될 있습니다.
amoeba는 Reinstate Monica라고

7
Hempel의 확인 역설을 고려하십시오. 까마귀를 조사하고 그것이 까맣다는 것을 보는 것은 "모든 까마귀가 까맣다"에 대한 지원입니다. 그러나 검은 색이 아닌 물체를 논리적으로 검사하고 까마귀가 아닌 것을 확인하면 "모든 까마귀는 검은 색"이고 "검은 색이 아닌 물체는 까마귀가 아닙니다"라는 문구는 논리적으로 동일하므로 제안을 뒷받침해야합니다. 해상도는 검은 색이 아닌 개체의 수가 까마귀의 수보다 훨씬 많으므로 검은 색 까마귀가 제안에 제공하는 지원은 검은 색이 아닌 비 까마귀가 제공하는 작은 지원보다 그에 상응하는 것입니다.
Ben

답변:


63

널 가설을 기각하지 못하는 것은 입니다 귀무 가설이 사실이라는 증거하지만, 특히하지 않을 수 있습니다 좋은 증거, 그것은 분명하지 않습니다 증명 귀무 가설을.

짧은 우회를하자. 오래된 진부한 순간을 고려하십시오.

증거의 부재는 부재의 증거가 아닙니다.

그 인기에도 불구하고,이 진술은 말이되지 않습니다. 무언가를 찾아 찾지 못하면 그것이 존재하지 않는다는 증거입니다. 증거가 얼마나 좋은지는 검색이 얼마나 철저했는지에 달려 있습니다. 커서 검색은 약한 증거를 제공합니다. 철저한 검색은 강력한 증거를 제공합니다.

이제 가설 검정으로 돌아갑니다. 가설 검정을 실행할 때 귀무 가설이 사실이 아니라는 증거를 찾고 있습니다. 그것을 찾지 못하면 그것은 아마도 귀무 가설 사실이라는 증거이지만, 그 증거는 얼마나 강력합니까? 이를 알기 위해서는 귀무 가설을 기각하게 한 증거가 검색을 피할 수 있었을 가능성이 어느 정도인지 알아야합니다. 즉, 테스트에서 오탐의 확률은 얼마입니까? 이것은 검정 의 검정력 ( )과 관련이 있습니다 (특히, 1- 의 보수 입니다).βββ

이제 테스트의 힘, 따라서 잘못된 음수 비율은 일반적으로 찾고있는 효과의 크기에 따라 다릅니다. 큰 효과는 작은 효과보다 감지하기 쉽습니다. 따라서 실험에 대한 단일 가 없으므로 귀무 가설에 대한 증거가 얼마나 강력한 지에 대한 결정적인 답은 없습니다. 다시 말해, 실험에서 배제되지 않을 정도로 작은 효과 크기 는 항상 있습니다 .β

여기에는 두 가지 방법이 있습니다. 때로는 임계 값보다 작은 효과 크기에 신경 쓰지 않는다는 것을 알고 있습니다. 이 경우 귀무 가설이 효과가 해당 임계 값보다 높다는 실험을 재구성 한 다음 효과가 임계 값보다 낮다는 대체 가설을 테스트해야합니다. 또는 결과를 사용하여 믿을 수있는 효과 크기에 대한 경계를 설정할 수 있습니다. 결론은 효과의 크기가 어느 정도 간격을두고 약간의 확률로 존재한다는 것입니다. 이러한 접근 방식은 베이지안 치료에서 조금만 벗어나면 이런 상황에 처한 경우에 대해 더 자세히 알고 싶을 수 있습니다.

결근 테스트의 증거 를 다루는 관련 질문에 대한 좋은 답변 이 있습니다.


9
, 및 중요하지 않은 p- 값을 사용한 가설 검정을 고려해 봅시다 . 당신의 추론에 따르면, 이것은 대한 증거입니다 . , 및 중요하지 않은 p- 값에 대한 또 다른 가설 검정 은 대한 몇 가지 증거를 제공 합니다. 이 증거는 분명히 모순된다. ˉ x = 3 μ 2 H 1 : μ < 4 ˉ x = 3 μ 4H1:μ>2x¯=3μ2H1:μ<4x¯=3μ4
Macond

4
나는 당신의 주장을 잘 모르겠습니다. 내가 말할 수있는 것은 두 개의 실험을 설명하는데, 각각의 실험은 서로 일관성이없는 두 가설 중 하나에 대한 증거를 제공합니다. 왜 이것이 놀라운가?
아무도

8
다른 예 : common . 거부하지 않으면 실제 라인의 다른 모든 값 중에서 실제 평균 정확히 0입니다. 이 답변은 잘못된 것입니다! H0:μ=0
Tim

3
나는 당신의 증거에 대한 설명을 좋아합니다 -그것은 한 모델 대 다른 모델에 대한 데이터의 지원을 정량화하는 것으로 Bayes 요소로 빠르게 이어질 것 같습니다. 않습니다 또는에 대한 증거를 제공 ? 그런데 그것은에 대한 사전 밀도에 따라 달라 : 당신이 생각하는 경우 의 두 곳에 불과 2에서 또는 어딘가에 훨씬 높은 3 이상이 데이터는 그것에 대한 증거를 제공; 가 -10과 10 사이에 있다고 생각 되면 데이터는 이에 대한 증거를 제공합니다. 그러나 빈번한 분석에서 당신의 믿음의 정도는 숫자로 표현되지 않으므로 어떤 개념의 증거가 적용됩니까? μ2μμμx¯=3μ2μμμ
Scortchi-복원 모니카

6
리만 가설을 생각 나게합니다. 우리는 실제 부분이 1/2 인 라인 외부의 사소한 0을 찾았지만 찾을 수 없었습니다. 우리가 그것을 증명하지 않았기 때문에 우리는 리만 가설을 참으로 간주하지 않지만, 대부분의 수학자들은 그것이 사실이라고 믿고 리만 가설이 참인지에 대해 조건부로 사실 인 많은 결과가 있습니다 :)이 경우에 우리는 해석했습니다 부재에 대한 증거로서 증거의 부재
개미

29

NHST는 p- 값에 의존하여 다음과 같이 알려줍니다. 귀무 가설이 참이면 데이터 (또는 더 극단적 인 데이터)를 관찰 할 확률은 얼마입니까?

귀무 가설이 참이라고 가정합니다. 귀무 가설이 100 % 정확하다는 NHST로 구워집니다. 작은 p- 값은 귀무 가설이 참이면 데이터 (또는 더 극단적 인 데이터)가 아닐 가능성이 있음을 나타냅니다.

그러나 큰 p- 값은 무엇을 알려줍니까? 그것은 귀무 가설이 주어지면 우리의 데이터 (또는 더 극단적 인 데이터)가 가능성이 있음을 알려줍니다.

일반적으로 P (A | B) ≠ P (B | A)입니다.

귀무 가설의 증거로 큰 p- 값을 원한다고 상상해보십시오. 이 논리에 의존합니다.

  • 널이 참이면 p- 값이 높을 수 있습니다. ( 업데이트 : 사실이 아닙니다. 아래의 설명을 참조하십시오. )
  • 높은 p- 값이 발견되었습니다.
  • 따라서 널이 참입니다.

이것은 더 일반적인 형태를 취합니다.

  • B가 참이면 A 일 가능성이 높습니다.
  • A가 발생합니다.
  • 따라서 B는 사실입니다.

그러나 이것은 예제에서 볼 수 있듯이 오류입니다.

  • 비가 오면 땅이 젖었을 가능성이 있습니다.
  • 땅이 젖었다
  • 따라서 비가 내렸다.

비가 와서 땅이 젖었을 수 있습니다. 또는 스프링클러, 홈통을 청소하는 사람, 수도 본관 등이 원인 일 수 있습니다. 위의 링크에서 더 극단적 인 예를 찾을 수 있습니다.

파악하기가 매우 어려운 개념입니다. null에 대한 증거를 원한다면 베이지안 추론이 필요합니다. 나에게이 논리에 대한 가장 접근하기 쉬운 설명은 Rouder et al. (2016). 종이 에 추론에 무료 점심이 있습니까? 에 게시 인지 과학, 8,에 주제 PP. 520-547.


3
모든 예제가 "X가 참"이라는 결론이 마음에 들지 않습니다. 무언가에 대한 증거를 갖는 것은 100 % 확실성을 가진 무언가를 결론 짓는 것과 다릅니다. 내가 밖에 나가서 땅이 젖었다면 그것은 "비가 내렸다"는 증거입니다. 이 증거는 비가되었을 가능성이 훨씬 높습니다.
Atte Juvonen

공정 해. 그 Rouder et al. 답변 끝 부분에 링크 된 논문에는 확실하게 결론이있는 예가 없습니다.
Mark White

6
@AtteJuvonen 예, 우리가 약간의 비에 대한 증거를하지만, 우리는 그것이 얼마나 가능성이 모르는, 그래서 당신이 할 수있는 유일한 결론이다 "는 비가 수도, 또는 지상 젖은 만든 그 뭔가 다른 수 있었다" . 그래서 당신은 할 결정적 증거를. 베이지안 통계의 근거에서만 반대 주장을 할 수 있습니다.
Tim

3
"우리가 널 (null)에 대한 증거를 원한다면 베이지안 추론이 필요합니다"라는 결론에 동의하지 않습니다. 당신이 인용하고있는 연구는 베이지안 통계의 매우 성가신 하드 코어 지지자 인 Wagenmakers의 것입니다. 그러나 사실 빈번한 패러다임에서 예를 들어 동등성에 대한 TOST (2 개의 일방적 인 테스트)를 수행함으로써 "널을위한"증거를 쉽게 얻을 수 있습니다. (cc @AtteJuvonen).
아메바는 Reinstate Monica가

10
"null이 참이면 p- 값이 높을 수 있습니다." -이것은 정확하지 않습니다. 귀무 가설이 참이면pU[0,1] 이므로 귀무 가설에서 값이 높을수록 값이 낮을 가능성은 없습니다. 당신이 말할 수있는 것은 값이 높을수록 다른 가설보다 null 아래에있을 가능성이 높다는 것입니다. 그러나 가설은 유지되거나 그렇지 않습니다. 우리가 베이지안 패러다임에서 일하지 않는 한! 그리고 불행히도 당신의 주장은 무너집니다. ppp
S. Kolassa-복원 모니카

14

가정의 문제점을 파악하려면 다음 예를 참조하십시오.

주민이 보이지 않는 동물원의 인클로저를 상상해보십시오. 바나나에 새장을 넣어 원숭이가 사는 가설을 테스트하고 다음 날 사라 졌는지 확인하려고합니다. 통계적 유의성이 향상되도록 N 번 반복합니다.

이제 귀무 가설을 공식화 할 수 있습니다. 인클로저에 원숭이가 있다고 가정하면 바나나를 찾아 먹을 가능성이 매우 높으므로 매일 바나나를 만지지 않으면 내부에 원숭이가있을 가능성이 매우 높습니다.

그러나 이제 바나나가 매일 (거의) 사라졌습니다. 원숭이가 안에 있다는 것을 알려주나요?

물론 바나나를 좋아하는 다른 동물들도 있기 때문에, 또는주의 깊은 동물원 사육사는 매일 저녁 바나나를 제거합니다.

그렇다면이 논리에서 저지른 실수는 무엇입니까? 요점은 원숭이가 없으면 바나나가 사라질 확률에 대해 아무것도 모른다는 것입니다. 귀무 가설을 뒷받침하려면 귀무 가설이 잘못된 경우 바나나 소실 가능성이 작아야하지만 반드시 그런 것은 아닙니다. 실제로 귀무 가설이 잘못된 경우 해당 사건은 똑같이 가능할 수 있습니다.

이 확률에 대해 알지 못하면 귀무 가설의 유효성에 대해 정확히 아무 것도 말할 수 없습니다. 사육사들이 매일 저녁 모든 바나나를 제거한다면, 귀무 가설을 확증 한 것으로 보아도 실험은 전혀 쓸모가 없습니다.


이것이 정답입니다.
Emily L.

2
@amoeba이 경우, 원숭이가 우리 안에있는 것입니다. 대체 최면술은 새장에 원숭이가 없다는 것입니다. 내가 수집 한 샘플은 매일 아침 "바나나 사라졌다"와 "바나나 아직도있다"라는 관측치입니다. 원숭이와 바나나를 찾는 능력에 대해 몇 가지 가정을하면서, 우리 안에있는 원숭이의 실제 결과를 볼 확률 p를 계산할 수 있습니다. 바나나가 여전히 자주 있다면, 나는 null hyp를 거부 할 것입니다. 바나나가 항상 사라지면 이것은 귀영 나팔에 적합하지만 원숭이가 우리 안에 있다는 것을 증명하지는 않습니다.
Thern

1
@amoeba 원숭이 예제를 t- 테스트 시나리오로 직접 번역 할 수 있는지 확실하지 않습니다. 내가 알기로는, 귀무 가설 테스트는 일반적으로 Mark White가 그의 답변에서 다음과 같이 썼다는 것을 의미합니다. t-testing 시나리오는이 경우의 구체적인 사례이지만 현재이 시나리오를 어떻게 일반화 할 수 있는지 모르겠습니다. 내 직감에서, 귀하의 시나리오와 원숭이 예제는 서로 직접적으로 매핑 될 수없는 두 가지 다른 가설 검정 방법입니다.
Thern

1
그렇다면 @Nebr이면 원숭이 예제의 의미에 대해 다시 매우 혼란 스럽습니다. T- 검정은 아마도 가장 일반적인 가설 검정 일 것입니다. 테스트의 전형적인 예이기 때문에 내 의견에 언급했습니다. 당신의 원숭이 예제가 이것에 적용 가능하지 않다면 (전형적으로)! 상황에 따라 그 의미에 대해 의아해합니다. 실제로 t-test와 monkey 예제가 "가설 테스트의 두 가지 다른 방법"이라고 말하면 원숭이 예제 "way"를 따르는 통계 테스트 예제를 제공 할 수 있습니까? 원숭이의 예는 정확히 무엇입니까?
amoeba 말한다 Reinstate Monica

1
@ Nebr 나는 이것이 일반적인 질문이라는 데 동의합니다. 그러나 원숭이 예제와 동일한 속성을 갖는 실제 통계 테스트 의 단일 예제를 제공 할 수 없다면 미안하지만 원숭이 예제를이 스레드와 관련이없는 것으로 고려해야합니다. 나는 원숭이 예제가 구체적으로 t- 테스트에 대응해야한다고 말하지 않습니다. 그러나 무언가 에 해당해야 합니다 !
amoeba는 Reinstate Monica가

14

Ioannidis 그의 유명한 논문 인 ' 가장 많이 발표 된 연구 결과가 거짓 인 이유'에서 베이지안 추론과 기본 요율 오류를 사용하여 대부분의 결과가 허위라고 주장했습니다. 곧, 특정 연구 가설이 참일 수있는 연구 후 확률은 무엇보다도 상기 가설의 연구 전 확률 (즉, 기본 요율)에 달려 있습니다.

이에 대한 응답으로 Moonesinghe et al. (2007) 은 동일한 프레임 워크를 사용하여 복제가 가설이 참된 연구 후 확률을 크게 증가 시킨다는 것을 보여 주었다. 여러 연구가 특정 결과를 모방 할 수 있다면 추측 된 가설이 사실이라고 확신합니다.

Moonesinghe et al.의 공식을 사용했습니다. (2007)은 결과를 모방하지 못한 경우 연구 후 확률을 보여주는 그래프를 작성합니다. 특정 연구 가설이 사전 연구 확률이 50 %라고 가정합니다. 또한 모든 연구에 바이어스가 (비현실적이지 않음) 80 %의 힘이 없으며 를 0.05로 사용한다고 가정합니다 .α연구 후 확률

그래프는 10 개 연구 중 5 개 이상이 유의성에 도달하지 못하면 가설이 참일 수있는 연구 후 확률이 거의 0임을 보여줍니다. 더 많은 연구에 대해 동일한 관계가 존재합니다. 이 발견은 또한 직관적 인 의미를 갖습니다. 효과를 반복적으로 찾지 못하면 그 효과가 거짓 일 가능성이 높다는 믿음이 강화됩니다. 이 추론은 @RPL의 승인 된 답변과 일치합니다.

두 번째 시나리오로, 연구의 검정력이 50 % (다른 모든 동등) 인 것으로 가정합니다.연구 후 확률 _pow50

이제 우리의 연구 후 확률은 더 느리게 감소합니다. 왜냐하면 모든 연구가 실제로 존재한다면 그 효과를 찾을 수있는 힘이 낮기 때문입니다.


검정이이 가설에 실패한 경우 귀무 가설에 대한 모든 증거를 얻습니다. 그러나 OP의 가정은 검정이 귀무 가설을 뒷받침한다는 것입니다 ( "우리가 대규모 연구를 수행하고 귀무 가설에 대해 통계적으로 유의미한 증거를 찾지 못하면 귀무 가설에 대한 증거가 아닙니까?"). 이것은 다이어그램의 가장 왼쪽 부분에 해당하므로 효과의 확률이 여전히 50 % (또는 일반적으로 사전 학습 확률) 인 경우에는 아무것도 얻지 못합니다.
Thern

@ Nebr 이해가 안 돼요. 우리가 1 개의 크고 강력한 연구 (95 % 검정력)를 수행하고 귀무 가설에 대한 증거를 찾지 못하면 (즉, 통계적 가설 검정이 5 % 수준에서 중요하지 않음), 연구 후 확률은 언급 된 프레임 워크에서 0.05이어야합니다 (사전 학습 확률 50 %).
COOLSerdash

1
@Nebr 마지막 ​​코멘트는 의미가 없습니다. 결과가 중요하지 않으면 "거짓 긍정적"일 수 없습니다.
amoeba는 Reinstate Monica라고

1
@Nebr- If you have a negative, you found evidence against the null무엇? "음수"라는 단어는 정반대의 의미를 갖습니다. 중요한 p- 값을 "양성"결과라고합니다. 중요하지 않은 것은 "음수"입니다.
amoeba는 Reinstate Monica라고

1
@Nebr 100 % 전력은 "H0이 참이면 항상 H1을 볼 수 있음"을 의미하지 않습니다. 즉, H1이 참이면 항상 H1을 보게됩니다. 모든 문장이 혼란 스럽기 때문에 더 이상 귀하의 의견을 읽으려고 시도하지 않을 것입니다.
amoeba 말한다 Reinstate Monica

12

내가 본 가장 좋은 설명은 수학에 관한 훈련을받은 사람에 대한 것입니다.

귀무 가설 유의성 검정은 기본적으로 모순에 의한 증거입니다. 이라고 가정 하고 대한 증거가H 1H0H1 있습니까? 에 대한 증거가있는 경우 거부 하고 승인하십시오 . 그러나 에 대한 증거가 없다면 이 처음부터 참 이라고 가정했기 때문에 이 참 이라고 말하는 것은 원형 입니다.H 0 H 1 H 1 H 0 H 0H1H0H1H1H0H0


4
아마 당신은이 스레드를보고해야합니다 : stats.stackexchange.com/questions/163957/…

10

가설 검정의 결과가 마음에 들지 않지만 베이지안 방법으로 완전히 도약 할 준비가되지 않은 경우 신뢰 구간은 어떻습니까?

동전을 번 머리를 보고 머리 확률에 대한 95 % 신뢰 구간이 합니다. 20913 [ 0.492 , 0.502 ]4207820913[0.492,0.502]

당신은 그것이 실제로 라는 증거를 보지 않았다고 말 했지만, 그 증거는 그것이 에 얼마나 가까이 있을지에 대한 약간의 확신을 암시 합니다. 11212


2
신뢰 구간에 대한 베이지안이란 무엇입니까?
kjetil b halvorsen

3
@kjetilbhalvorsen : 신뢰 구간은 베이지안이 아니며 (신뢰할 수있는 구간 일 것입니다.) 신뢰 구간은 증거에 대한 자세한 정보를 제공하며 간단한 가설 거부 / 거부 거부
Henry

9

귀무 가설에 대한 비 거부 자체가 귀무 가설에 대한 증거가 아니라고 말하는 것이 좋습니다. 데이터의 양을보다 명시 적으로 고려하는 데이터의 전체 가능성을 고려하면 수집 된 데이터는 귀무 가설에 포함 된 모수에 대한 지원을 제공 할 수 있습니다.

그러나 우리는 또한 우리의 가설에 대해 신중하게 생각해야합니다. 특히, 점 귀무 가설을 기각하지 못하는 것이 점 귀무 가설이 참이라는 증거는 아닙니다. 실제로 매개 변수의 실제 값이 해당 지점에서 멀지 않은 증거를 축적합니다. 점 귀무 가설은 어느 정도 인공적인 구성물이며, 대부분 사실이라고 생각하지 않습니다.

귀무 가설을지지하는 비 거절에 대해 이야기하는 것이 더 합리적입니다. 귀무 가설과 대립 가설을 의미있게 뒤집을 수 있고 그렇게 할 경우 새로운 귀무 가설을 기각 할 수 있습니다. 표준 점 귀무 가설을 사용하여이 작업을 수행하려고하면 역점 귀무 가설이 고려중인 점에 임의로 근접한 값을 포함하기 때문에 보완을 거부 할 수 없다는 것을 즉시 알 수 있습니다.

반면에, 귀무 가설 테스트하는 경우대체 에 대한정규 분포의 평균에 대해 , 그리고 의 실제 값에 대해 표본 크기가 있습니다. 실제로 의 실제 값 이 또는 가 아닌 경우 거의 100 % 확률을 갖습니다. 레벨 신뢰 구간은 내에 구간 밖에 있습니다. 유한 표본 크기의 경우 경계를 가로 지르는 신뢰 구간을 얻을 수 있습니다.이 경우 귀무 가설에 대한 모든 강력한 증거가 아닙니다.H A : | μ | > δ μ μ - δ + δ (1) - α [ - δ , + δ ]H0:|μ|δHA:|μ|>δμμδ+δ1α[δ,+δ]


4
+1. 이 IMHO는 허용되는 답변이어야합니다. 왜 그렇게 공언이 적은지 이해가되지 않습니다.
amoeba는 Reinstate Monica라고

1
@amoeba은 늦게 게시되었으므로 동의하고 이미 +1했습니다.
Tim

6

오히려 언어를 어떻게 사용하는지에 달려 있습니다. Pearson and Neyman 의사 결정 이론에 따르면 이는 널에 대한 증거는 아니지만 널이 참인 것처럼 행동해야합니다.

어려움은 modus tollens에서 비롯됩니다. 베이지안 방법은 귀납적 추리의 한 형태이며, 따라서 불완전한 추리의 한 형태입니다. 귀무 가설 방법은 확률 론적 형태의 modus tollens이며 연역적 추론의 일부이므로 완전한 추론의 형태입니다.

Modus tollens의 형식은 "A가 참이면 B가 참이고 B가 참이 아니므로 A가 참이 아닙니다."입니다. 이 형식에서, 널이 참이면 데이터가 특정 방식으로 나타나고, 그런 식으로 나타나지 않기 때문에 (어떤 정도의 확신으로) 널이 참이 아닙니다 (또는 적어도 "위조 됨" "

문제는 "A이면 B와 B"를 원한다는 것입니다. 이것으로부터 A를 추론하려고하지만 유효하지 않습니다. "A이면 B이면"은 "A가 아니라면 B이면"도 유효한 진술에서 제외되지 않습니다. "곰이라면 수영 할 수있다. 물고기 (곰이 아님)"라는 문장을 고려해 보자. 성명서는 비곰이 수영하는 능력에 대해 아무 말도하지 않습니다.

확률과 통계는 수사학의 분기이며 수학의 분기가 아닙니다. 수학을 많이 사용하지만 수학의 일부는 아닙니다. 다양한 이유, 설득, 의사 결정 또는 추론이 있습니다. 그것은 수사를 규율 된 증거에 대한 토론으로 확장시킨다.


1
Neyman과 Pearson을 언급하면 ​​+1입니다 ( stats.stackexchange.com/questions/125541 참조 ).
amoeba는 Reinstate Monica라고

5

나는 이것을 예를 들어 설명하려고 노력할 것이다.

평균 대한 테스트 의도로 모집단에서 샘플링한다고 생각합시다 . mean 샘플을 얻습니다 . 우리가 아닌 중요한 p- 값을 얻는 경우에 우리는 다른 귀무 가설을 테스트했다면, 우리는 또한 비 상당한 P-값을 얻을 것 있도록, 사이에 와 . 이제 어떤 가치의 대한 증거가 있습니까?μx¯H0:μ=μiμiμ0x¯μ

또한 중요한 p- 값을 얻을 때 특정 대한 증거를 얻지 않고 대신 대한 증거입니다 ( 대한 증거로 어렵습니다). 상황에 따라 , 또는 ). 가설 검정의 본질은 무언가에 대한 증거를 제공하지 않으며, 만약 그것이 있다면 무언가에 대해서만 증거를 제공합니다.H1:μ=MH0:μ=μ0μμ0μ<μ0μ>μ0


"이제 어떤 μ의 가치에 대한 증거가 있습니까?" -표본 평균에 더 가까운 값에 대해서는 더 강력한 증거가 있고 표본 평균에 더 가까운 값에 대해서는 더 적은 증거가 있습니다. 샘플의 크기와 분산에 따라 강도가 약하거나 약합니다. 이 해석에 문제가 있습니까?
Atte Juvonen

예, 이것은 잘못된 해석입니다. P 값은 귀무 가설이 참일 가능성이 없거나 귀무 가설을지지하는 증거의 강도가 아닙니다. 이와 유사하게 구간 중간에 표본 평균을 사용하여 구간 추정을 수행 할 수 있지만 이는 집단 평균이 구간 중간에 가까울 가능성이 높다는 것을 의미하지는 않습니다. 귀하의 질문에 대한 Dominic Comtois의 의견에는이 오해에 대한 좋은 설명이 있습니다.
Macond

"이것은 인구 평균이 구간의 중간에 가까울 확률이 높다는 것을 의미하지는 않습니다." -이것은 정확하지 않습니다. 나는 신문을 읽었지만 이것을 뒷받침 할만한 것을 찾을 수 없었다.
Atte Juvonen

신뢰 구간의 중간은 해당 하며 관측 된 표본 평균이 확률이 높습니다. 그러나 이것은 " '가 중간에 가까울수록 진정한 평균 일 확률이 높다 "는 진술과 동일하지 않다 . 여러 번 언급 한 바와 같이 : . μμP(A|B)P(B|A)
Macond

4

평균과 (아래 그림) 작은 데이터 세트 고려 , 당신이 양측을 실시 말할 와 -test , 어디 . 테스트는 중요하지 않은 것으로 보입니다 . 그것은 당신의 이 사실 이라는 것을 의미합니까 ? 에 대해 테스트 한 경우 어떻게 됩니까? 때문에 분포가 대칭, 시험은 유사한 반환 - 값을. 따라서 와 와 거의 같은 양의 증거 가 있습니다.x¯0tH0:x¯=μμ=0.5p>0.05H0μ=0.5tpμ=0.5μ=0.5

두 가지 대안 가설

위의 예는 작은 것을 알 수 -values는 믿음에서 떨어져 우리를 인도 높은 것으로 -values은 우리의 데이터를 어떻게 든 더 일관성이 있음을 시사 , 에 비해 . 이러한 많은 테스트를 수행 한 경우 데이터가 제공 될 가능성 이 가장 높은 를 찾을 수 있으며 실제로 반 최대 우도 추정을 사용하게 됩니다. MLE의 아이디어는 당신이 같은 가치를 추구한다는 것입니다 주어진 데이터를 관찰 확률 극대화 , 무슨 일이 우도 함수로 연결pH0pH0 H1μμμ

L(μ|X)=f(X|μ)

MLE은 대한 점 추정치를 찾는 올바른 방법 이지만 데이터가 주어진 를 관찰 할 가능성에 대해서는 아무 것도 알려주지 않습니다 . 당신이 한 일은 대한 단일 값을 선택하고 주어진 데이터를 관찰 할 가능성에 대해 물었습니다. 다른 사람들이 이미 알고 있듯이 . 를 찾으려면 에 대해 서로 다른 후보 값에 대해 테스트 한 사실을 고려해야합니다 . 이것은 베이 즈 정리로 연결됩니다 μ^μμ^μ F(μ|X)F(X|μ)F(μ|X) μμ^f(μ|X)f(X|μ)f(μ|X)μ^

f(μ|X)=f(X|μ)f(μ)f(X|μ)f(μ)dμ

첫 번째, 다른 가능성을 고려 의 선험적 둘째, 당신은 다른 후보로 간주한다는 사실을 정규화 (이 MLE와 일치하는 결과에 이르게 무엇 균일 할 수 있습니다) . 또한 확률 론적 용어로 에 대해 물으면 임의 변수로 간주해야하므로 이것이 베이지안 접근 방식을 채택하는 또 다른 이유입니다.μμ^μ

결론적으로, 가설 검정은 이 보다 더 가능성이 높은지를 알려줍니다 . 그러나 절차에서 이 참 이라고 가정 하고 특정 값을 선택해야합니다. 유추하기 위해 테스트가 오라클이라고 상상해보십시오. 당신이 그녀에게 물었다면, "땅이 젖었다. 비가 올 가능성이 있는가?" 그녀는 대답 할 것입니다. "그렇습니다. 비가 오면 83 %가 땅이 젖어있을 수 있습니다. " 그녀에게 다시 물으면 "누군가 땅에 물을 쏟았을 가능성이 있습니까?" 그녀는 "어떤 사람이 땅에 물을 엎질러 젖었을 때 100 % 가능할 수도 있습니다."라고 대답 할 것입니다.H1H0H0등을 요청하면, 그녀는 당신에게 번호를 줄 것이지만, 숫자 는 비교할 수 없습니다 . 문제는 가설 검정 / 오라클이 프레임 워크에서 작동한다는 것입니다. 여기서 다른 가설을 고려하지 않기 때문에 데이터가 다른 가설과 일치 하지 않는지 에 대한 질문에 대해서만 결정적인 답을 줄 수 있습니다 .


2

간단한 예를 봅시다.

내 귀무 가설은 내 데이터가 정규 분포를 따른다는 것입니다. 다른 가설은 내 데이터의 분포가 정상이 아니라는 것입니다.

[0,1]의 균일 분포에서 두 개의 랜덤 표본을 추출합니다. 두 개의 표본만으로는 많은 것을 할 수 없으므로 귀무 가설을 기각 할 수 없습니다.

데이터가 정규 분포를 따른다는 결론을 내릴 수 있습니까? 아니, 그것은 균일 한 분포입니다 !!

문제는 내가 귀무 가설에서 정규성을 가정한다는 것입니다. 따라서 나는 그것을 거부 할 수 없기 때문에 내 가정이 옳다고 결론을 내릴 수 없습니다.


3
나는 2 개의 샘플을 가진 연구가 "연구"의 자격을 가진 것으로 생각하지 않는다. 합리적인 수의 데이터 요소를 그리 자마자이 예제는 작동하지 않습니다. 1000 개의 데이터 점을 그려 균일 한 분포처럼 보이는 경우 귀무 가설에 대한 증거가 있습니다. 1000 개의 데이터 점을 그리고 정규 분포처럼 보이는 경우 귀무 가설에 대한 증거가 있습니다.
Atte Juvonen

1
@AtteJuvonen 내 대답은 연구가 무엇인지 정의하려는 시도가 아닙니다. 나는 단순히 질문에 대한 통계적 힘이 없다는 것을 설명하기 위해 간단한 예를 제시하려고 노력합니다. 우리는 모두 2 개의 샘플이 나쁘다는 것을 알고 있습니다.
SmallChess

4
권리. 나는 당신의 예가 2 개의 샘플에서 결론을 도출하는 문제를 설명한다고 말하고 있습니다. 귀무 가설에 대한 증거를 도출하는 문제는 설명하지 않습니다.
Atte Juvonen

2

거부 하려면 연구에 충분한 통계 능력 이 있어야합니다 . 을 기각 할 수 있다면 결론을 도출하기에 충분한 데이터를 수집했다고 말할 수 있습니다.H 0H0H0

반면, 거부 하지 않으면 기본적으로 true로 가정되므로 데이터가 전혀 필요하지 않습니다. 따라서 연구에서 기각하지 않으면 어떤 것이 더 가능성이 알 수 없습니다. 이 참이거나 연구가 충분히 크지 않았습니다 .H 0 H 0H0H0H0


무언가에 대한 증거를 갖는 것은 100 % 확실성을 가진 무언가를 아는 것과는 다릅니다. " 이 맞는지 알 필요가 없습니다 ". 을 거부하더라도 이 참 인지는 여전히 "알지"않습니다 . H 0 H 0H0H0H0
Atte Juvonen

0

아닙니다. 증거라는 증거가 없으면 증거가 아닙니다. 나는 귀엽고 오히려 문자 그대로하려고합니다. 널이 참이라고 가정하면 그러한 데이터를 볼 확률 만 있습니다. p- 값에서 얻는 것이 전부입니다 (p- 값은 가정 자체를 기반으로하기 때문에).

귀무 가설을 지원하기 위해 "실패"한 연구에 대해 귀무 가설의 대부분이 사실로 밝혀 졌다는 연구 결과를 제시 할 수 있습니까? 당신이 THAT 연구를 찾을 수 있다면, 귀무 가설을 반증하지 않는 것은 적어도 귀무가 사실 일 가능성이 매우 일반화 된 가능성을 반영합니다. 나는 당신에게 그 연구가 없다는 것을 내기하고 있습니다. p- 값에 근거하여 귀무 가설과 관련된 증거가 없기 때문에 빈 손으로 걸어야합니다.

해당 p- 값을 얻기 위해 널이 참이라고 가정하여 시작했기 때문에 p- 값은 널에 대해 아무것도, 데이터에 대해서만 말할 수 있습니다. 생각 해봐 단방향 추론 기간입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.