이항 랜덤 변수의 표본 평균에 대한 표준 오차


43

내가 2 개의 결과를 가질 수있는 실험을 실행 중이고 2 개의 결과의 기본 "진정한"분포가 모수 n 갖는 이항 분포라고 가정합니다 p. Binomial(n,p) .

표준 오류를 계산할 수 있습니다. SEX=σXn 의 변화의 형태로부터 Binomial(n,p):

σX2=npq
여기서,q=1p. 따라서σX=npq . 표준 오류의 경우SEX=pq 이지만SEX=pqn . 내가 뭘 잘못 했어?


내 인터넷 검색에서 이항 분포에 대한 신뢰 구간을 얻는 것과 밀접하게 관련된 주제는 다소 미묘하고 복잡합니다. 특히 "Wald Intervals"( en.wikipedia.org/wiki/Binomial_proportion_confidence_interval 참조 ) 인 이 공식에서 얻은 신뢰 구간 은 다소 열악한 동작이므로 피해야합니다. 자세한 내용은 jstor.org/stable/2676784?seq=1#metadata_info_tab_contents 를 참조하십시오 .
aquirdturtle

답변:


58

샘플 크기와 이항 랜덤 변수를 구성하는 베르누이 시행 횟수와 같이 두 가지 방식으로 두 번 사용하는 것 같습니다 . 모호성을 없애기 위해 k 를 사용 하여 후자를 참조합니다.nk

B i n o m i a l ( k , p ) 분포 에서 독립 표본 이있는 경우 표본 평균의 분산은 다음과 같습니다.nBinomial(k,p)

var(1ni=1nXi)=1n2i=1nvar(Xi)=nvar(Xi)n2=var(Xi)n=kpqn

여기서 이고 ¯ X 는 동일한 평균입니다. 이후부터q=1pX¯

(1) ,var(cX)=c2var(X) 어떤 확률 변수에 대한 , 및 임의의 상수 C .Xc

(2) 독립 랜덤 변수의 합의 분산은 분산의 합과 같습니다 .

의 표준 오차 는 분산의 제곱근입니다. X¯ . 따라서,kpqn

  • 일 때 지적한 공식을 얻습니다. k=npq

  • , 그리고 이항 변수는 단지입니다 베르누이 시행은 , 당신은 당신이 다른 곳에서 본 적이 공식을 얻을 : k=1pqn


3
경우 A는 베르누이 랜덤 변수 다음 v에 R ( X ) = P (Q)를 . 경우 X가 에 기초 이항 확률 변수를 갖는 N 개의 성공 확률과 실험 Pv에 R을 ( X ) = N (P)의 QXvar(X)=pqXnpvar(X)=npq
매크로

2
감사! 당신은 내 혼란을 해제했습니다. 너무 초등해서 죄송합니다. 저는 여전히 배우고 있습니다 :-)
Frank

6
그래서 우리는 상수 c Var (cX) = c 2 Var (x)에 대해 사실을 사용하고 있다는 것이 Frank에게 분명 합니까? 비율의 표본 추정치가 X / n이므로 Var (X / n) = Var (X) / n 2 = npq / n 2 = pq / n이고 SEx는 그 제곱근입니다. 우리가 모든 단계를 철회하면 모든 사람들에게 더 분명하다고 생각합니다. 222
Michael Chernick 2016 년

1
@MichaelChernick, 나는 당신이 언급 한 세부 사항을 분명히했습니다. 문제 설명을 바탕으로 Frank는 이러한 사실을 알고 있지만 향후 독자가 세부 사항을 포함시키는 것이 더 교육적이라고 생각합니다.
Macro

2
Sol Lago-이 경우 k = 1입니다. 동전을 50 번 뒤집고 성공 횟수를 계산 한 다음 실험을 50 번 반복하면 k = n = 50입니다. 1 또는 0 그것은 베르누이 RV이다의 경화 결과 플립
B_Miner

9

두 개의 이항 분포를 혼동하기 쉽습니다.

  • 성공 횟수 분포
  • 성공 비율의 분포

npq는 성공 횟수이고 npq / n = pq는 성공 비율입니다. 이로 인해 표준 오차 공식이 달라집니다.


6

우리는 이것을 다음과 같은 방식으로 볼 수 있습니다 :

nYY=i=1nXiXi

XiY

YY

pqpq=1p

이제, 우리는의 차이를 보면 , . 그러나 모든 개별 Bernoulli 실험에 대해 입니다. 이 때문에 실험에서 토스 또는 베르누이 시행 . 이는 에 분산 가 있음을 의미합니다 .YV(Y)=V(Xi)=V(Xi)V(Xi)=pqnV(Y)=V(Xi)=npqYnpq

이제 샘플 비율은 주어지며 , 이는 '성공 또는 헤드의 비율'을 제공합니다. 여기서 은 모집단의 모든 실험에 대해 동일한 동전 던지기를 계획하지 않기 때문에 상수입니다.p^=Ynn

따라서 입니다.V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n

따라서, (표본 통계량)의 표준 오차 는p^pq/n


수학 주위에 달러를 넣어서 라텍스 조판을 사용할 수 있습니다 (예 : $x$gives . x
Silverfish

참고 단계 것을 정말 어떤 정당성을 가치가있다! V(Xi)=V(Xi)
Silverfish

마지막 공제에는 오타가 있으며 V (Y / n) = (1 / n ^ 2) * V (Y) = (1 / n ^ 2) * npq = pq / n은 올바른 공제 여야합니다.
Tarashankar

사과, 나는 조판을 할 때 그것을 소개했습니다. 희망적으로 정렬되었습니다.
Silverfish

1
Xi

2

표준 오류와 표준 편차 사이의 초기 게시물에도 약간의 혼란이 있다고 생각합니다. 표준 편차는 분포 분산의 sqrt입니다. 표준 오차는 해당 분포에서 표본의 추정 평균의 표준 편차, 즉 표본을 무한정 여러 번 수행 한 경우 관찰 할 평균의 확산입니다. 전자는 분포의 고유 속성입니다. 후자는 분포의 특성 (평균) 추정치의 품질을 측정 한 것입니다. 알 수없는 성공 확률을 추정하기 위해 N Bernouilli 시행을 실험 할 때 k 성공을 본 후 추정 된 p = k / N의 불확실성은 추정 비율 sqrt (pq / N)의 표준 오차입니다. 여기서 q = 1 -피. 실제 분포는 성공 확률 인 모수 P를 특징으로합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.