이것은 아마도 정확하지만 아마도 그다지 유용하지 않은 대답의 본성 일 것입니다. Horvitz와 Thompson (1952)은 이러한 상황을 전반적으로 다루는 결과를 제공합니다. 이러한 결과는 예상 할 수있는 조합 표현의 관점에서 제공됩니다.
표기법과 일관성을 유지하고 널리 사용되는 표기법과 더 잘 일치하도록 몇 가지 수량을 재정의하겠습니다. 하자 인구의 요소 수있을 및 샘플 크기.Nn
하자 , 의 대표 주어진 값 모집단의 요소 , 및 선택의 확률 . 주어진 크기 표본에 대해 표본의 관측 값을 합니다.uii=1,...,NNVii=1,...,Np1,...,pNnv1,...,vn
바람직한 것은 샘플 총 의 평균 및 분산이다
∑i=1nvi.
주석에서 언급했듯이 순서대로 그려진 특정 샘플 를 선택할 확률 은
여기서 그림 의 초기 확률 은 에 의해 주어지고 , 그림 의 두 번째 확률 는 모집단에서 를 제거한 조건에 . 따라서 추후의 각 단위는 다음 단위에 대해 새로운 확률 분포를 초래합니다 (따라서 각각 다른 분포를 나타 내기 때문에 다른 표시 문자 선택).s={ui,uj,...,ut}
Pr(s)=pi1pj2⋯ptn,
pi1uipipj2ujui
거기
전체 모집단에서 를 포함
하는 크기 의 샘플 . 이것은 을 고려합니다샘플의 순열.
S(i)=n!(N−1n−1)
nuin!
하자 크기의 특정 샘플 나타내고 포함 . 그리고, 소자의 선택 확률 주어진다
합산 크기의 세트 이상이고 의 를 포함 하는 크기 의 모든 가능한 샘플 . (저는 혼란스러워 보이기 때문에 종이에서 표기법을 약간 변경했습니다.)s(i)nnuiui
P(ui)=∑Pr(s(i)n),
S(i)s(i)nnui
마찬가지로
및
를 모두 포함하는 샘플 수로 . 그런 다음 모두 포함하는 표본의 확률을 정의 할 수 있습니다
여기서 합은 크기 가능한 모든 샘플 크기의 함유하는 것이 및 .
S(ij)=n!(N−2n−2)
uiujP(uiuj)=∑Pr(s(ij)n),
S(ij)s(ij)nnuiuj
그런 다음 예상 값은
E(∑i=1nvi)=∑i=1NP(ui)Vi.
분산은 논문에서 명시 적으로 도출되지 않았지만, 번째 모멘트
및 교차 제품
q
E(∑i=1nvqi)=∑i=1NP(ui)Vqi
E(∑i≠jnvivj)=∑i≠jP(uiuj)ViVj.
다시 말해, 이러한 계산을 수행하려면 가능한 모든 하위 집합을 거쳐야하는 것처럼 보입니다. 그러나 이것은 더 작은 값에 대해 수행 될 수 있습니다 .n
Horvitz, DG 및 Thompson, DJ (1952) 유한 한 우주를 대체하지 않고 샘플링을 일반화했습니다. 미국 통계 협회 저널 47 (260) : 663-685.