다른 통계 책이 무엇인지 말하지 않지만 유한 모집단 샘플링에 관한 책 (또는 섹션)이라고 생각합니다. .
당신 샘플 확률 변수, 당신은 일련의 생각 즉, 때되면
의 N 확률 변수를, 당신은 알고 그들이 독립적 인 경우 F를 ( X 1 , ...은 , X N ) = F ( X 1 ) ⋯ F ( x n ) , 동일하게 분포 된 , 특히 E ( X i ) = μ 및 Var ( XX1,…,Xnnf(x1,…,xn)=f(x1)⋯f(xn)E(Xi)=μ모든 i에 대해 = σ 2 이면 :
¯ X = ∑ i X iVar(Xi)=σ2i
여기서,σ2번째 중심 모멘트이다.
X¯¯¯¯=∑iXin,E(X¯¯¯¯)=μ,Var(X¯¯¯¯)=σ2n
σ2
유한 모집단 샘플링은 다소 다릅니다. 모집단의 크기가 인 경우 교체없이 샘플링 할 때 ( NN 크기가n 인가능한 표본si는 다음과 같습니다.
p(si)=1(Nn)sin
예를 들어N=5이고n=3인 경우 샘플 공간은{s1,…,s10}
이고 가능한 샘플은 다음과 같습니다.
s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4
p(si)=1(Nn)∀i=1,…,(Nn)
N=5n=3{s1,…,s10}(하자 반복합니다. 대충.)
각 개인의 발생 횟수를 세면 6 개임을 알 수 있습니다. 즉, 각 개인의 선택이 동일합니다 (6/10). 따라서 각
si는 두 번째 정의에 따른 무작위 표본입니다. 대략 개인이 임의의 변수가 아니기 때문에 대략 임의의 표본이 아닙니다. 표본 평균으로
E[X]를일관되게 추정 할 수는 있지만 정확한 값
을알
수는없지만
n=N 인경우 정확한 모집단 평균을 알
수 있습니다s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
siE[X]n=N1
μn<Nμ
y¯¯¯s=∑i=1nyi,E(y¯¯¯s)=μ
Var(y¯¯¯s)=σ~2n(1−nN)
σ~2∑Ni=1(yi−y¯¯¯)2N−1(1−n/N) 을 보통 "
유한 모집단 보정 계수 "라고합니다.
이것은 (임의 변수) iid 랜덤 샘플과 (유한 모집단) 랜덤 샘플이 어떻게 다른지에 대한 간단한 예입니다. 통계적 추론 은 주로 랜덤 변수 샘플링에 관한 것이며 , 샘플링 이론 은 유한 모집단 샘플링에 관한 것입니다.
1 전구를 제조 중이고 평균 수명을 알고 싶다고 가정하십시오. 당신의 "인구"는 적어도 전구를 계속 생산한다면 이론적이거나 가상적인 것입니다. 따라서 데이터 생성 프로세스 를 모델링해야합니다전구 세트를 (무작위 변수) 샘플로 해석합니다. 1000 개의 전구 상자를 찾아 평균 수명을 알고 싶다고 가정 해보십시오. 작은 전구 세트 (유한 모집단 샘플)를 선택할 수 있지만 모든 전구를 선택할 수 있습니다. 작은 샘플을 선택하면 전구가 임의의 변수로 변환되지 않습니다. "all"과 "small set"사이의 선택에 따라 임의의 변수가 생성됩니다. 그러나 유한 인구가 매우 많은 경우 (예 : 국가 인구) "모두"를 선택할 수없는 경우 두 번째 상황이 첫 번째 상황으로 더 잘 처리됩니다.