귀무 가설 유의성 검정의 기본 한계는 연구원이 귀무에 찬성하여 증거를 수집 할 수 없다는 것입니다 ( 출처 )
이 주장이 여러 곳에서 반복되는 것을 보았지만 이에 대한 정당성을 찾을 수 없습니다. 대규모 연구를 수행 하고 귀무 가설에 대한 통계적으로 유의미한 증거를 찾지 못하면 귀무 가설 에 대한 증거 가 아닌가?
귀무 가설 유의성 검정의 기본 한계는 연구원이 귀무에 찬성하여 증거를 수집 할 수 없다는 것입니다 ( 출처 )
이 주장이 여러 곳에서 반복되는 것을 보았지만 이에 대한 정당성을 찾을 수 없습니다. 대규모 연구를 수행 하고 귀무 가설에 대한 통계적으로 유의미한 증거를 찾지 못하면 귀무 가설 에 대한 증거 가 아닌가?
답변:
널 가설을 기각하지 못하는 것은 입니다 귀무 가설이 사실이라는 증거하지만, 특히하지 않을 수 있습니다 좋은 증거, 그것은 분명하지 않습니다 증명 귀무 가설을.
짧은 우회를하자. 오래된 진부한 순간을 고려하십시오.
증거의 부재는 부재의 증거가 아닙니다.
그 인기에도 불구하고,이 진술은 말이되지 않습니다. 무언가를 찾아 찾지 못하면 그것이 존재하지 않는다는 증거입니다. 증거가 얼마나 좋은지는 검색이 얼마나 철저했는지에 달려 있습니다. 커서 검색은 약한 증거를 제공합니다. 철저한 검색은 강력한 증거를 제공합니다.
이제 가설 검정으로 돌아갑니다. 가설 검정을 실행할 때 귀무 가설이 사실이 아니라는 증거를 찾고 있습니다. 그것을 찾지 못하면 그것은 아마도 귀무 가설 이 사실이라는 증거이지만, 그 증거는 얼마나 강력합니까? 이를 알기 위해서는 귀무 가설을 기각하게 한 증거가 검색을 피할 수 있었을 가능성이 어느 정도인지 알아야합니다. 즉, 테스트에서 오탐의 확률은 얼마입니까? 이것은 검정 의 검정력 ( )과 관련이 있습니다 (특히, 1- 의 보수 입니다).β
이제 테스트의 힘, 따라서 잘못된 음수 비율은 일반적으로 찾고있는 효과의 크기에 따라 다릅니다. 큰 효과는 작은 효과보다 감지하기 쉽습니다. 따라서 실험에 대한 단일 가 없으므로 귀무 가설에 대한 증거가 얼마나 강력한 지에 대한 결정적인 답은 없습니다. 다시 말해, 실험에서 배제되지 않을 정도로 작은 효과 크기 는 항상 있습니다 .
여기에는 두 가지 방법이 있습니다. 때로는 임계 값보다 작은 효과 크기에 신경 쓰지 않는다는 것을 알고 있습니다. 이 경우 귀무 가설이 효과가 해당 임계 값보다 높다는 실험을 재구성 한 다음 효과가 임계 값보다 낮다는 대체 가설을 테스트해야합니다. 또는 결과를 사용하여 믿을 수있는 효과 크기에 대한 경계를 설정할 수 있습니다. 결론은 효과의 크기가 어느 정도 간격을두고 약간의 확률로 존재한다는 것입니다. 이러한 접근 방식은 베이지안 치료에서 조금만 벗어나면 이런 상황에 처한 경우에 대해 더 자세히 알고 싶을 수 있습니다.
결근 테스트의 증거 를 다루는 관련 질문에 대한 좋은 답변 이 있습니다.
NHST는 p- 값에 의존하여 다음과 같이 알려줍니다. 귀무 가설이 참이면 데이터 (또는 더 극단적 인 데이터)를 관찰 할 확률은 얼마입니까?
귀무 가설이 참이라고 가정합니다. 귀무 가설이 100 % 정확하다는 NHST로 구워집니다. 작은 p- 값은 귀무 가설이 참이면 데이터 (또는 더 극단적 인 데이터)가 아닐 가능성이 있음을 나타냅니다.
그러나 큰 p- 값은 무엇을 알려줍니까? 그것은 귀무 가설이 주어지면 우리의 데이터 (또는 더 극단적 인 데이터)가 가능성이 있음을 알려줍니다.
일반적으로 P (A | B) ≠ P (B | A)입니다.
귀무 가설의 증거로 큰 p- 값을 원한다고 상상해보십시오. 이 논리에 의존합니다.
이것은 더 일반적인 형태를 취합니다.
그러나 이것은 예제에서 볼 수 있듯이 오류입니다.
비가 와서 땅이 젖었을 수 있습니다. 또는 스프링클러, 홈통을 청소하는 사람, 수도 본관 등이 원인 일 수 있습니다. 위의 링크에서 더 극단적 인 예를 찾을 수 있습니다.
파악하기가 매우 어려운 개념입니다. null에 대한 증거를 원한다면 베이지안 추론이 필요합니다. 나에게이 논리에 대한 가장 접근하기 쉬운 설명은 Rouder et al. (2016). 종이 에 추론에 무료 점심이 있습니까? 에 게시 인지 과학, 8,에 주제 PP. 520-547.
가정의 문제점을 파악하려면 다음 예를 참조하십시오.
주민이 보이지 않는 동물원의 인클로저를 상상해보십시오. 바나나에 새장을 넣어 원숭이가 사는 가설을 테스트하고 다음 날 사라 졌는지 확인하려고합니다. 통계적 유의성이 향상되도록 N 번 반복합니다.
이제 귀무 가설을 공식화 할 수 있습니다. 인클로저에 원숭이가 있다고 가정하면 바나나를 찾아 먹을 가능성이 매우 높으므로 매일 바나나를 만지지 않으면 내부에 원숭이가있을 가능성이 매우 높습니다.
그러나 이제 바나나가 매일 (거의) 사라졌습니다. 원숭이가 안에 있다는 것을 알려주나요?
물론 바나나를 좋아하는 다른 동물들도 있기 때문에, 또는주의 깊은 동물원 사육사는 매일 저녁 바나나를 제거합니다.
그렇다면이 논리에서 저지른 실수는 무엇입니까? 요점은 원숭이가 없으면 바나나가 사라질 확률에 대해 아무것도 모른다는 것입니다. 귀무 가설을 뒷받침하려면 귀무 가설이 잘못된 경우 바나나 소실 가능성이 작아야하지만 반드시 그런 것은 아닙니다. 실제로 귀무 가설이 잘못된 경우 해당 사건은 똑같이 가능할 수 있습니다.
이 확률에 대해 알지 못하면 귀무 가설의 유효성에 대해 정확히 아무 것도 말할 수 없습니다. 사육사들이 매일 저녁 모든 바나나를 제거한다면, 귀무 가설을 확증 한 것으로 보아도 실험은 전혀 쓸모가 없습니다.
Ioannidis 는 그의 유명한 논문 인 ' 가장 많이 발표 된 연구 결과가 거짓 인 이유'에서 베이지안 추론과 기본 요율 오류를 사용하여 대부분의 결과가 허위라고 주장했습니다. 곧, 특정 연구 가설이 참일 수있는 연구 후 확률은 무엇보다도 상기 가설의 연구 전 확률 (즉, 기본 요율)에 달려 있습니다.
이에 대한 응답으로 Moonesinghe et al. (2007) 은 동일한 프레임 워크를 사용하여 복제가 가설이 참된 연구 후 확률을 크게 증가 시킨다는 것을 보여 주었다. 여러 연구가 특정 결과를 모방 할 수 있다면 추측 된 가설이 사실이라고 확신합니다.
Moonesinghe et al.의 공식을 사용했습니다. (2007)은 결과를 모방하지 못한 경우 연구 후 확률을 보여주는 그래프를 작성합니다. 특정 연구 가설이 사전 연구 확률이 50 %라고 가정합니다. 또한 모든 연구에 바이어스가 (비현실적이지 않음) 80 %의 힘이 없으며 를 0.05로 사용한다고 가정합니다 .
그래프는 10 개 연구 중 5 개 이상이 유의성에 도달하지 못하면 가설이 참일 수있는 연구 후 확률이 거의 0임을 보여줍니다. 더 많은 연구에 대해 동일한 관계가 존재합니다. 이 발견은 또한 직관적 인 의미를 갖습니다. 효과를 반복적으로 찾지 못하면 그 효과가 거짓 일 가능성이 높다는 믿음이 강화됩니다. 이 추론은 @RPL의 승인 된 답변과 일치합니다.
두 번째 시나리오로, 연구의 검정력이 50 % (다른 모든 동등) 인 것으로 가정합니다.
이제 우리의 연구 후 확률은 더 느리게 감소합니다. 왜냐하면 모든 연구가 실제로 존재한다면 그 효과를 찾을 수있는 힘이 낮기 때문입니다.
If you have a negative, you found evidence against the null
무엇? "음수"라는 단어는 정반대의 의미를 갖습니다. 중요한 p- 값을 "양성"결과라고합니다. 중요하지 않은 것은 "음수"입니다.
내가 본 가장 좋은 설명은 수학에 관한 훈련을받은 사람에 대한 것입니다.
귀무 가설 유의성 검정은 기본적으로 모순에 의한 증거입니다. 이라고 가정 하고 대한 증거가H 1 있습니까? 에 대한 증거가있는 경우 거부 하고 승인하십시오 . 그러나 에 대한 증거가 없다면 이 처음부터 참 이라고 가정했기 때문에 이 참 이라고 말하는 것은 원형 입니다.H 0 H 1 H 1 H 0 H 0
가설 검정의 결과가 마음에 들지 않지만 베이지안 방법으로 완전히 도약 할 준비가되지 않은 경우 신뢰 구간은 어떻습니까?
동전을 번 머리를 보고 머리 확률에 대한 95 % 신뢰 구간이 합니다. 20913 [ 0.492 , 0.502 ]
당신은 그것이 실제로 라는 증거를 보지 않았다고 말 했지만, 그 증거는 그것이 에 얼마나 가까이 있을지에 대한 약간의 확신을 암시 합니다. 1
귀무 가설에 대한 비 거부 자체가 귀무 가설에 대한 증거가 아니라고 말하는 것이 좋습니다. 데이터의 양을보다 명시 적으로 고려하는 데이터의 전체 가능성을 고려하면 수집 된 데이터는 귀무 가설에 포함 된 모수에 대한 지원을 제공 할 수 있습니다.
그러나 우리는 또한 우리의 가설에 대해 신중하게 생각해야합니다. 특히, 점 귀무 가설을 기각하지 못하는 것이 점 귀무 가설이 참이라는 증거는 아닙니다. 실제로 매개 변수의 실제 값이 해당 지점에서 멀지 않은 증거를 축적합니다. 점 귀무 가설은 어느 정도 인공적인 구성물이며, 대부분 사실이라고 생각하지 않습니다.
귀무 가설을지지하는 비 거절에 대해 이야기하는 것이 더 합리적입니다. 귀무 가설과 대립 가설을 의미있게 뒤집을 수 있고 그렇게 할 경우 새로운 귀무 가설을 기각 할 수 있습니다. 표준 점 귀무 가설을 사용하여이 작업을 수행하려고하면 역점 귀무 가설이 고려중인 점에 임의로 근접한 값을 포함하기 때문에 보완을 거부 할 수 없다는 것을 즉시 알 수 있습니다.
반면에, 귀무 가설 테스트하는 경우대체 에 대한정규 분포의 평균에 대해 , 그리고 의 실제 값에 대해 표본 크기가 있습니다. 실제로 의 실제 값 이 또는 가 아닌 경우 거의 100 % 확률을 갖습니다. 레벨 신뢰 구간은 내에 구간 밖에 있습니다. 유한 표본 크기의 경우 경계를 가로 지르는 신뢰 구간을 얻을 수 있습니다.이 경우 귀무 가설에 대한 모든 강력한 증거가 아닙니다.H A : | μ | > δ μ μ - δ + δ (1) - α [ - δ , + δ ]
오히려 언어를 어떻게 사용하는지에 달려 있습니다. Pearson and Neyman 의사 결정 이론에 따르면 이는 널에 대한 증거는 아니지만 널이 참인 것처럼 행동해야합니다.
어려움은 modus tollens에서 비롯됩니다. 베이지안 방법은 귀납적 추리의 한 형태이며, 따라서 불완전한 추리의 한 형태입니다. 귀무 가설 방법은 확률 론적 형태의 modus tollens이며 연역적 추론의 일부이므로 완전한 추론의 형태입니다.
Modus tollens의 형식은 "A가 참이면 B가 참이고 B가 참이 아니므로 A가 참이 아닙니다."입니다. 이 형식에서, 널이 참이면 데이터가 특정 방식으로 나타나고, 그런 식으로 나타나지 않기 때문에 (어떤 정도의 확신으로) 널이 참이 아닙니다 (또는 적어도 "위조 됨" "
문제는 "A이면 B와 B"를 원한다는 것입니다. 이것으로부터 A를 추론하려고하지만 유효하지 않습니다. "A이면 B이면"은 "A가 아니라면 B이면"도 유효한 진술에서 제외되지 않습니다. "곰이라면 수영 할 수있다. 물고기 (곰이 아님)"라는 문장을 고려해 보자. 성명서는 비곰이 수영하는 능력에 대해 아무 말도하지 않습니다.
확률과 통계는 수사학의 분기이며 수학의 분기가 아닙니다. 수학을 많이 사용하지만 수학의 일부는 아닙니다. 다양한 이유, 설득, 의사 결정 또는 추론이 있습니다. 그것은 수사를 규율 된 증거에 대한 토론으로 확장시킨다.
나는 이것을 예를 들어 설명하려고 노력할 것이다.
평균 대한 테스트 의도로 모집단에서 샘플링한다고 생각합시다 . mean 샘플을 얻습니다 . 우리가 아닌 중요한 p- 값을 얻는 경우에 우리는 다른 귀무 가설을 테스트했다면, 우리는 또한 비 상당한 P-값을 얻을 것 있도록, 사이에 와 . 이제 어떤 가치의 대한 증거가 있습니까?
또한 중요한 p- 값을 얻을 때 특정 대한 증거를 얻지 않고 대신 대한 증거입니다 ( 대한 증거로 어렵습니다). 상황에 따라 , 또는 ). 가설 검정의 본질은 무언가에 대한 증거를 제공하지 않으며, 만약 그것이 있다면 무언가에 대해서만 증거를 제공합니다.
평균과 (아래 그림) 작은 데이터 세트 고려 , 당신이 양측을 실시 말할 와 -test , 어디 . 테스트는 중요하지 않은 것으로 보입니다 . 그것은 당신의 이 사실 이라는 것을 의미합니까 ? 에 대해 테스트 한 경우 어떻게 됩니까? 때문에 분포가 대칭, 시험은 유사한 반환 - 값을. 따라서 와 와 거의 같은 양의 증거 가 있습니다.
위의 예는 작은 것을 알 수 -values는 믿음에서 떨어져 우리를 인도 높은 것으로 -values은 우리의 데이터를 어떻게 든 더 일관성이 있음을 시사 , 에 비해 . 이러한 많은 테스트를 수행 한 경우 데이터가 제공 될 가능성 이 가장 높은 를 찾을 수 있으며 실제로 반 최대 우도 추정을 사용하게 됩니다. MLE의 아이디어는 당신이 같은 가치를 추구한다는 것입니다 주어진 데이터를 관찰 확률 극대화 , 무슨 일이 우도 함수로 연결
MLE은 대한 점 추정치를 찾는 올바른 방법 이지만 데이터가 주어진 를 관찰 할 가능성에 대해서는 아무 것도 알려주지 않습니다 . 당신이 한 일은 대한 단일 값을 선택하고 주어진 데이터를 관찰 할 가능성에 대해 물었습니다. 다른 사람들이 이미 알고 있듯이 . 를 찾으려면 에 대해 서로 다른 후보 값에 대해 테스트 한 사실을 고려해야합니다 . 이것은 베이 즈 정리로 연결됩니다 μμ F(μ|X)≠F(X|μ)F(μ|X) μ
첫 번째, 다른 가능성을 고려 의 선험적 둘째, 당신은 다른 후보로 간주한다는 사실을 정규화 (이 MLE와 일치하는 결과에 이르게 무엇 균일 할 수 있습니다) . 또한 확률 론적 용어로 에 대해 물으면 임의 변수로 간주해야하므로 이것이 베이지안 접근 방식을 채택하는 또 다른 이유입니다.
결론적으로, 가설 검정은 이 보다 더 가능성이 높은지를 알려줍니다 . 그러나 절차에서 이 참 이라고 가정 하고 특정 값을 선택해야합니다. 유추하기 위해 테스트가 오라클이라고 상상해보십시오. 당신이 그녀에게 물었다면, "땅이 젖었다. 비가 올 가능성이 있는가?" 그녀는 대답 할 것입니다. "그렇습니다. 비가 오면 83 %가 땅이 젖어있을 수 있습니다. " 그녀에게 다시 물으면 "누군가 땅에 물을 쏟았을 가능성이 있습니까?" 그녀는 "어떤 사람이 땅에 물을 엎질러 젖었을 때 100 % 가능할 수도 있습니다."라고 대답 할 것입니다.등을 요청하면, 그녀는 당신에게 번호를 줄 것이지만, 숫자 는 비교할 수 없습니다 . 문제는 가설 검정 / 오라클이 프레임 워크에서 작동한다는 것입니다. 여기서 다른 가설을 고려하지 않기 때문에 데이터가 다른 가설과 일치 하지 않는지 에 대한 질문에 대해서만 결정적인 답을 줄 수 있습니다 .
간단한 예를 봅시다.
내 귀무 가설은 내 데이터가 정규 분포를 따른다는 것입니다. 다른 가설은 내 데이터의 분포가 정상이 아니라는 것입니다.
[0,1]의 균일 분포에서 두 개의 랜덤 표본을 추출합니다. 두 개의 표본만으로는 많은 것을 할 수 없으므로 귀무 가설을 기각 할 수 없습니다.
데이터가 정규 분포를 따른다는 결론을 내릴 수 있습니까? 아니, 그것은 균일 한 분포입니다 !!
문제는 내가 귀무 가설에서 정규성을 가정한다는 것입니다. 따라서 나는 그것을 거부 할 수 없기 때문에 내 가정이 옳다고 결론을 내릴 수 없습니다.
거부 하려면 연구에 충분한 통계 능력 이 있어야합니다 . 을 기각 할 수 있다면 결론을 도출하기에 충분한 데이터를 수집했다고 말할 수 있습니다.H 0
반면, 거부 하지 않으면 기본적으로 true로 가정되므로 데이터가 전혀 필요하지 않습니다. 따라서 연구에서 기각하지 않으면 어떤 것이 더 가능성이 알 수 없습니다. 이 참이거나 연구가 충분히 크지 않았습니다 .H 0 H 0
아닙니다. 증거라는 증거가 없으면 증거가 아닙니다. 나는 귀엽고 오히려 문자 그대로하려고합니다. 널이 참이라고 가정하면 그러한 데이터를 볼 확률 만 있습니다. p- 값에서 얻는 것이 전부입니다 (p- 값은 가정 자체를 기반으로하기 때문에).
귀무 가설을 지원하기 위해 "실패"한 연구에 대해 귀무 가설의 대부분이 사실로 밝혀 졌다는 연구 결과를 제시 할 수 있습니까? 당신이 THAT 연구를 찾을 수 있다면, 귀무 가설을 반증하지 않는 것은 적어도 귀무가 사실 일 가능성이 매우 일반화 된 가능성을 반영합니다. 나는 당신에게 그 연구가 없다는 것을 내기하고 있습니다. p- 값에 근거하여 귀무 가설과 관련된 증거가 없기 때문에 빈 손으로 걸어야합니다.
해당 p- 값을 얻기 위해 널이 참이라고 가정하여 시작했기 때문에 p- 값은 널에 대해 아무것도, 데이터에 대해서만 말할 수 있습니다. 생각 해봐 단방향 추론 기간입니다.