모집단을 샘플링하는 방법이 중요합니까?


9

나는 많은 수의 구슬이 들어있는 잘 섞인 통을 가지고 있습니다. 저기 통에 구슬의 무한한 양이지만, 그들은 단지의 알 수없는 그러나 유한 수에 와서 품종 : 는 알 수 없으며 , 경우 유형 대리석을 그리는 것이 유형 대리석을 그리는 것보다 더 쉽습니다 .

V={v1,v2,v3,...,vk}
kijvivj

실험에서, 기계는 알려지지 않은 절차를 사용하여 통을 샘플링합니다. 기계 는 샘플에서 종류의 대리석을 설명 하는 세트 를 보고합니다 . Xqk

XV;|X|=q

이 실험의 평가판이 반복되고 ( 는 시험판에서 고정됨) , 의 하위 집합 시퀀스를 얻습니다 .qV(X1,X2,)

우리가 아는 유일한 것은 :

  • 시험은 독립적이며 동일합니다
  • 기계 는 샘플에서 가장 자주 발생하는 상위 종을 보고합니다.q

우리는 기계가 어떻게 구슬을 샘플링하는지 정확히 알지 못합니다. 많은 수의 구슬을 선택한 다음 가장 자주 보고 할 수 있습니다. 또는, 종류 가 될 때까지 구슬을 계속 집어들 수 있습니다. 그것도 할 수있는 다른 일들이 있습니다.qq

평가판 배포 가 기계의 샘플링 절차에 영향을 받습니까?(X1,X2,)


3
+1 이것은 모호한 형태의 임의성 또는 샘플링 절차에 대한 지식이 부족한 것보다 무작위 샘플링이 더 많음을 인식하기 때문에 큰 질문입니다.
whuber

샘플링 규칙은 확실히 중요합니다. 그렇지 않으면이 절차를 고려하십시오. 모든 시험에서 기계는 항상 유형 1 (1 종)의 단일 대리석을 선택합니다. 각 추첨은 독립적이며 동일한 분포 (사소한)를 가지며, 당신은 완벽하게 도움이되지 않는 q = 1을 얻습니다.
AlaskaRon

답변:


9

방법이 중요한지 확인하는 간단한 방법은 구슬 유형에 대한 특정 확률을 선택하고 일부 방법에 따라 각 하위 집합의 확률을 계산하는 것입니다. 그러나 이것은 방법이 중요하지 않다는 것을 증명할 수 없습니다.

가지 유형이 있고 각 유형의 확률이 각각 , 및 이라고 가정 합니다. 가지 유형의 구슬을 선택한다고 가정하십시오 .31/21/41/42

대리석을 선택한 후 나머지 종류는 무시한다고 가정하십시오. 를 얻을 확률 은 입니다.{v2,v3}21/41/3=1/6

반복되는 유형의 쌍을 거부한다고 가정하십시오. 가능성 있다{v2,v3}

21/41/421/41/4+21/21/4+21/21/4=1/81/8+1/4+1/4=1/5.

이것들이 다르기 때문에 기계가 사용하는 방법이 중요합니다. 반복되는 유형으로 쌍을 거부하면 공통 유형으로 쌍을 가중시키는 경향이 있습니다.

언급 한 두 가지 방법은 동일합니다. 대리석을 따기 후 그것의 종류의 나머지 부분을 무시하면 때까지 따기와 동일한 다른 유형.q

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.