귀무 가설이 아닌 샘플링을 통해 생성 된 신뢰 구간으로 귀무 가설을 기각 할 수 있습니까?


9

모집단에서 샘플링 한 후 신뢰 구간 형식으로 모수 추정값을 생성 할 수 있다고 배웠습니다. 예를 들어, 가정을 위반하지 않은 95 % 신뢰 구간은 모집단에서 추정하는 실제 모수가 무엇이든 95 %의 성공률을 가져야합니다.

즉,

  1. 표본에서 점 추정치를 생성합니다.
  2. 이론적으로 우리가 추정하려고하는 실제 값을 포함 할 확률이 95 % 인 값 범위를 생성합니다.

그러나 주제가 가설 검정으로 바뀌었을 때 단계는 다음과 같이 설명되었습니다.

  1. 일부 모수를 귀무 가설로 가정하십시오.
  2. 이 귀무 가설이 참인 경우 다양한 점 추정치를 얻을 가능성의 확률 분포를 생성합니다.
  3. 귀무 가설이 참인 경우 우리가 얻는 포인트 추정치가 시간의 5 % 미만으로 생성된다면 귀무 가설을 기각합니다.

내 질문은 이것입니다 :

귀무 가설을 사용하여 귀무를 기각하기 위해 신뢰 구간을 생성해야합니까? 왜 첫 번째 절차를 수행하고 실제 모수에 대한 추정값 (신뢰 구간 계산시 가설 값을 명시 적으로 사용하지 않음)을 얻은 다음 귀무 가설이이 구간 내에 속하지 않으면이를 거부하지 않겠습니까?

이것은 논리적으로 나에게 논리적으로 동등한 것처럼 보이지만, 아마도 이것이 이런 식으로 가르쳐지는 이유가 있기 때문에 매우 근본적인 것을 놓치고 있다고 두려워합니다.


불분명 한 것에 대해 사과드립니다, Martijn. 나중에 동일한 질문을 찾는 사람들이 더 명확하도록 게시물을 곧 편집 할 것입니다. 내가 의미하는 바는 표본에서 모수 추정치를 계산하거나 귀무 가설을 사용 하여 귀무 가설 을 지원하는 것으로 추정되는 추정 범위를 계산할 수 있다는 것입니다 . 나는 단순히 우리의 모수 추정치를 사용하고 널이 모수 추정치의 범위 내에 있는지 확인하기보다는 점 추정치 가이 간격에 있는지 확인하기 위해 널을 사용해야하는 이유를 이해하지 못했습니다. 나는 그것이 의미가 있기를 바랍니다!
Nikli

재미있는 생각 실험은 누군가가 당신에게 가중 주사위를 판매하려고 시도하는 것입니다. 그것들을 굴린 다음 관찰 한 방향으로 가중된다고 말하십시오 (예 : 6은 시간의 20 %를 나타냄). 그것들은 얼마나 많은 가중치를 받았으며 (샘플 던지기가 충분 했습니까), 자신의 (추가) 주사위 던지기 테스트를 수행하는 것이 가치가 있습니까? 판매자와 구매자의 목표는 서로 다릅니다.
Philip Oakley

답변:


5

간단한 문제는 예를 들어 분산이 알려진 정규 모집단의 평균을 테스트하여 제공됩니다. σ2=1. 그런 다음 피벗-분포가 매개 변수에 의존하지 않는 수량은 다음과 같이 주어집니다.Y¯μN(0,1/n). 임계 값zα/2 이 대칭적인 경우에는 Φ(zα/2)=α/2Φ(zα/2)=1α/2.

따라서 하여 은 수준 의 신뢰 구간입니다 .

1α=Pr{(X¯μ)/(1/n)(zα/2,zα/2)}=Pr{zα/2(X¯μ)nzα/2}=Pr{zα/2(μX¯)nzα/2}=Pr{zα/2/nμX¯zα/2/n}=Pr{X¯zα/2/nμX¯+zα/2/n}=Pr{(X¯zα/2/n,X¯+zα/2/n)μ}
(X¯zα/2/n,X¯+zα/2/n)
1α

동시에, 디스플레이의 첫 번째 줄의 이벤트는 정확하게이 대해 귀무 가설이 기각되지 않는 이벤트입니다 . 나머지는 동등한 변환을 포함하기 때문에 ci에는 실제로 널이 거부되지 않는 모든 가 포함되며 "널 아래"에 대한 참조가 필요하지 않습니다.μμ

다음은 신뢰 구간과 테스트 간의 이중성이라는 것을 보여주기 위해 Martijn의 +1 시각화와 유사한 플롯입니다. 일부 구간에 속하는 신뢰도 나타낸다 및 어떤 가설에 속하는 수용 영역 .Cx¯A(μ0)μ=μ0

여기에 이미지 설명을 입력하십시오


10

예. 표본에서 계산 된 신뢰 구간과 비교하여 가설 검정 (가설을 검정 결과 분포와 비교)을 대치 할 수 있습니다. 그러나 간접적으로 신뢰 구간은 이미 일종의 가설 검정입니다.

  • 신뢰 구간이 수준 가설 검정이 성공α 하고 수준 가설 검정이 실패 하는 범위의 값으로 구성되는 것으로 볼 수 있습니다 .α

이러한 범위를 만든 결과 범위는 시간 의 일부 만 실패합니다 .α

나는 아래 질문에 대한 답변의 이미지를 사용하고 있습니다 : 신뢰 간격 : 공식적으로P(L(X)θ,U(X)θ)=1α

Clopper-Pearson 의 그래프 변형입니다 . 성공 확률이 이고 총 성공 횟수 가 관측되는 100 개의 Bernoulli 시행의 사례를 상상해보십시오 .θX

기준 확률

참고 :

  • 수직 방향으로 가설 검정을 볼 수 있습니다. 예를 들어, 주어진 가설 값 대해 측정 된 가 빨간색 또는 초록색 점선 위 또는 아래에 있으면 가설을 기각합니다 .θX

  • 수평 방향으로 Clopper-Pearson 신뢰 구간이 표시됩니다. 주어진 관측치 X에 대해 이러한 신뢰 구간을 사용하면 시간의 5 % 만 잘못됩니다

    (시간의 5 % 인 '잘못된'간격을 기준으로하는 X 만 관찰하기 때문에)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.