비열 등성 테스트에서 널을 받아 들일 수 있습니까?


11

일반적인 가설 검정 방법을 사용하여 일반적인 t- 검정 방법에서는 null을 거부하거나 null을 거부하지 않지만 null을 허용하지 않습니다. 이에 대한 한 가지 이유는 더 많은 증거를 얻을 경우 동일한 효과 크기가 중요해지기 때문입니다.

그러나 비열 등성 테스트는 어떻게됩니까?

그건:

H0:μ1μ0x

vs.

H1:μ1μ0>x

여기서 는 본질적으로 동일한 것으로 간주되는 금액입니다. 따라서 null을 거부하면 이 보다 크거나 이상이라고 합니다. 증거가 충분하지 않으면 null을 거부하지 않습니다. xμ1μ0x

효과 크기가 이상이면 정규 t- 검정과 유사합니다. 그러나 샘플에서 효과 크기가 보다 작 으면 어떻게해야합니까? 그런 다음 샘플 크기를 늘리고 동일한 효과를 유지하면 의미가 없습니다. 그러므로이 경우 널을 받아 들일 수 있습니까?xx


1
당신의 가설이 뒤섞여 있습니까? 일반적으로 NI 테스트의 경우 귀무 가설은 차이가 x보다 크다는 것이고, 대안은 x보다 크거나 같다는 것입니다. 나는 그것이 당신의 차이 척도의 순서에 달려 있다고 생각합니다.
Björn

안녕 @ Björn 그것은 더 높거나 나쁘거나 더 나은지에 달려 있습니다.
Peter Flom

1
단측 테스트에서 null을 허용 할 수 있는지 묻는 것과 동일합니까? stats.stackexchange.com/a/85914 에 대한 의견에서 이에 대한 논의가 있었습니다 .
amoeba

2
@amoeba Peter는 역설에 더 가까운 매혹적인 논증 (+1)을 제시한다고 생각합니다. "H0을 받아들이지 않는"이유에 대한 일반적인 설명 중 하나는 "더 많은 증거를 얻으면 동일한 효과 크기가 커질 것"입니다. 그러나 베드로와 같은 논리에 따라, 우리는 어떤 상황에서 우리 "H0"을 받아 들여야하거나 그렇지 않은 경우 "이유"가 실제로 잘못되었다는 결론에 도달하게됩니다 . 나는 당신이 옳다고 믿습니다. 그의 논증은 n이 증가함에 따라 부정적인 효과 크기가 미미한 것으로 남아 있기 때문에 일방적 인 t- 검정에도 적용됩니다
Silverfish

1
예, 동의합니다. 링크 된 답변이 귀하의 질문에 답변하지 않습니다. 의견에 관련 토론이 있었기 때문에 링크 만 제공했습니다.
amoeba

답변:


7

당신의 논리는 독자들에게 친숙 할 수 있는 좋은 오래된 단측 테스트 ( ) 와 정확히 같은 방식으로 적용됩니다 . 구체적으로, 가 양수인 대안에 대해 널 을 테스트한다고 가정 하십시오 . 그런 다음 true 가 음수이면 샘플 크기를 늘려도 중요한 결과를 얻지 못합니다. 즉, 단어를 사용한다고해서 "더 많은 증거를 얻으면 동일한 효과 크기가 커질 것"은 아닙니다.x=0H0:μ0μμ

을 테스트하면 세 가지 가능한 결과를 얻을 수 있습니다.H0:μ0

  1. 먼저 신뢰 구간은 완전히 0보다 수 있습니다. 그런 다음 null을 거부하고 대안을 수락합니다 ( 는 양수).(1α)100%μ

  2. 둘째, 신뢰 구간은 전적으로 0 미만일 수 있습니다. 이 경우 null을 거부하지 않습니다. 그러나이 경우 을 다른 null로 간주 하고 거부 할 수 있기 때문에 "null을 수락"한다고 말하는 것이 좋습니다.H1

  3. 셋째, 신뢰 구간에는 0이 포함될 수 있습니다. 그러면 거부 할 수없고 거부 할 수 없으므로 수락 할 것이 없습니다.H0H1

그래서 나는 일방적 인 상황에서 null을 받아 들일 수 있다고 말할 것입니다. 그러나 우리는 그것을 거부하지 않았기 때문에 그것을 받아 들일 수 없습니다. 두 가지가 아닌 세 가지 가능성이 있습니다.

(동일성 테스트, 즉 "일측 테스트"(TOST), 비열 등성 테스트 등에도 동일하게 적용됩니다. 널을 거부하거나 널을 승인하거나 결정적이지 않은 결과를 얻을 수 있습니다.)

반면에 H0 다음과 같은 점이 null입니다. H0:μ=0받아 들일 수 없습니다. 왜냐하면 H1:μ0 유효한 귀무 가설을 구성하지 않습니다.

(가 아니면 μ불연속 값만 가질 수 있습니다. 예를 들어 정수 여야합니다. 우리가 받아 들일 수있을 것 같아H0:μ=0 때문에 H1:μZ,μ0이제 유효한 귀무 가설을 구성합니다. 이것은 약간 특별한 경우입니다.)


이 문제는 @ gung 's answer here의 주석에서 얼마 전에 논의되었습니다. 통계학자가 왜 중요하지 않은 결과가 귀무 가설을 받아들이는 것과는 달리 "귀무를 기각 할 수 없음"을 의미한다고 말합니까?

흥미로운 (투표가 적은) 스레드를 참조하십시오. Neyman-Pearson 접근 방식에서 null을 거부하지 못하면 스레드 를 "수락"해야합니까? @Scortchi는 Neyman-Pearson 프레임 워크에서 일부 저자는 "null 허용"에 대해 아무런 문제가 없다고 설명합니다. 그것은 또한 @Alexis가 그녀의 대답의 마지막 단락에서 의미하는 바입니다.


만약 (1α) 신뢰 구간이 완전히 0보다 큰 경우 μ0: 최악의 크기의 테스트입니다. α2. 만약(1α) 신뢰 구간이 완전히 0 미만인 경우 null을 거부합니다. μ>0: 최악의 크기의 테스트입니다. α2. 두 테스트를 결합하면 최악의 크기를 유지할 수 있습니다.α2두 개의 널이 상호 배타적이므로 따라서 세 가지 결과는 하나의 대안 또는 다른 대안을 수용하거나 널 (null)을 거부하지 않는 것으로 설명 될 수 있습니다.
Scortchi-복원 모니카

양측 테스트는 두 개의 단측 테스트로 구성된 것과 유사하게 생각할 수 있습니다. 그러나 대안은 상호 배타적이지 않으며 최악의 크기는α (언제 μ=0).
Scortchi-Monica Monica 복원

감사합니다 @Scortchi. 어떻게 든 당신이 내 대답에 동의하거나 동의하지 않는지는 확실하지 않습니다.
amoeba

같이 μ0승인되지 ...로서 하나 개의 테스트에 널 (null)을,하지만 ...로서 , 나는 "널 (null)을 받아들이는"느낌이 다른의 대안은 불필요하게 여기 혼란; 그럼에도 불구하고 당신의 절차는 충동을 가진 사람들을 만족시켜야합니다. 아마도 귀하의 대답에서 강조해야 할 것은 비열 등성 대 열등성에 대한 테스트와 그 반대로 의 차이와 우수성 대 비 우월성 (또는 null null) 및 열등 성 vs 비열 등성 (또는 null null) 테스트의 차이점입니다 .
Scortchi-복원 Monica Monica

@Scortchi 마지막 문장의 구문은 매우 복잡합니다. 정확히 결합 할 수있는 것과 그렇지 않은 것의 차이점은 무엇입니까? 잘 이해했는지 모르겠습니다. 죄송합니다.
amoeba

6

우리는 절대 귀무 가설을 받아들이지 않습니다 (힘과 최소 관련 효과 크기도 고려하지 않음). 단일 가설 검정을 통해 자연 상태를 취합니다.H0그런 다음 질문의 일부 변형에 대답합니다. H0 (그리고 우리의 분포 가정)이 맞습니까? " H0 선호하는 제 1 종 오류율을 바탕으로 항상 HA… 결론을 내릴 증거를 찾았습니다 HA또는 결론을 내릴 증거를 찾지 못했습니다 HA. 우리는 받아들이지 않는다H0증거를 찾지 않았기 때문입니다. 증거의 부재 (예 : 차이)는 부재의 증거 (예 : 차이)와 동일하지 않습니다. .

이것은 양면 테스트와 마찬가지로 단면 테스트의 경우에도 마찬가지입니다. 우리 는 찬성하는 증거 찾습니다.HA 그것을 찾거나 찾지 마십시오.

우리가 하나만 포즈 하면H0(적절한 최소 효과 크기와 통계적 힘 모두에 세심한주의를 기울이지 않고), 우리는 증거를 찾지 않았기 때문에 확인 편향에 대한 우선적 인 약속을 효과적으로하고 있습니다.H0에 대한 증거 만 HA. 물론, 우리는 할 수 있습니다 (그리고, 내가 감히 해야한다 (과 위치에 대해 포즈 널 가설을) 관련 시험 (차이에 대한 테스트를 결합H0+)에 대한 테스트 (H0)이 작업을 수행하십시오.

당신이 일방적 테스트에서 추론을 결합 할 수없는 이유가 없다는 것을 나에게 보인다 열등감에 대한 일방적 인 테스트와 비열 등성에 동시에 양방향으로 증거를 제공 (또는 증거의 부족).

물론, 힘 효과의 크기를 고려 하고 있고 거부하지 않는다면H0그러나 (a) 최소 관련 효과 크기가 있음을 알고 있습니다. δ(b) 데이터가 주어진 테스트에 대해 데이터를 탐지 할 수있을만큼 강력하다는 것을 증명할 수 있습니다. H0.


1
Peter의 질문에는이 답변이 뒤섞인 것처럼 보이는 흥미로운 흥미로운 점이 포함되어 있습니다. 표준 "H0 기각 실패"용어에 대한 일반적인 설명 중 하나는 예를 들어 t- 검정에서 더 많은 증거를 얻은 경우 동일한 효과라는 것입니다 크기가 커질 것입니다. 그러나 이것이 우리가 "거부하지 않는" "실제적인"이유라면, 그가 설명하는 상황에서 "H0을 받아 들일 수있다"는 그의 주장은 (적어도 나에게는) 강한 것으로 보인다. 의식적으로나 고의적으로가 아니라 일종의 통계 속어로 우연히하는 것 이외의 일을 보았습니다.
실버 피쉬

1
이 대답은 훌륭하고 간결한 간결한 방식으로 "H0 수용"에 대한 기존의 입장을 되풀이하지만 Peter의 질문의 핵심에서 논증 (또는 아마도 역설)을 직접 다루지는 않는 것 같습니다. "우리는 더 많은 증거를 얻었을 때 동일한 효과 크기가 중요해지기 때문에 H0를 받아 들일 수 없다"고 어떻게 생각하십니까? Peter의 표현이나 확장에 결함이 있거나 논리에 해당합니까? 처음에는 유효하지 않은 최초의 논쟁 중?
실버 피쉬

1
@Silverfish는 "관련성 테스트"에 대한 답변의 링크를 따라 "우리는 더 많은 증거를 얻었을 때 동일한 효과 크기가 중요해지기 때문에 H0를 받아 들일 수 없습니다"라는 문제에 대한 비판적 해결책을 더 많이 증폭시킵니다.
Alexis

1
@Alexis Silverfish에 동의해야합니다. 귀하의 답변에 감사 드리지만 Silverfish가 성명을 발표 한 이유 때문에 핵심 사항을 다루지 않습니다. 우리가 N = 1,000,000을 가졌다면 표준 설정에서 거의 차이가있을 것입니다. 그러나 열등하지 않은 경우에는 그렇지 않습니다. 그리고 TOST 양면에서도 그렇지 않습니다. 차이가 우리가 중요하다고 생각하는 양보다 작 으면 N은 그것을 시그마하게 만들지 않을 것입니다.
Peter Flom

1
사과-내 첫 번째 의견은 단지 두 번째의 서막으로 의도 된 것이며 (보다 정확하게는 두 번째는 첫 번째의 오버플로였습니다!) 독자적인 관점을 높이려는 의도는 없었습니다. 링크가 도움이되었습니다. 당신의 중심점 (당신의 답과 당신의 진술에서 매우 훌륭하게 설명)은 왜 당신이 베드로의 결론에 동의하지 않는지를 분명히 설명합니다 . 그러나 나는 당신이 결함은 자신에 느꼈다 곳 궁금 논리 아마도 그 또는 - 전제 . 이것은 직접적으로 다루어지지 않은 느낌입니다.
실버 피쉬
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.