발생의 무작위 샘플링을 기반으로 이벤트 빈도를 추정 할 수 있습니까?


9

일부 수정 사항 ...

이 질문은 단지 재미를위한 것이므로 재미 있지 않다면 무시하십시오. 나는 이미이 사이트에서 많은 도움을 얻으므로 나를 먹이는 손을 물고 싶지 않습니다. 실제 사례를 기반으로하며 내가 많이 궁금해 한 것입니다.

월요일부터 금요일까지 무작위로 훈련하기 위해 현지 도조를 방문합니다. 일주일에 두 번 방문한다고 가정 해 봅시다. 즉, 매주 정확히 두 번 방문하며 이틀 만 바뀝니다. 내가있을 때마다 거의 항상 한 사람이 있습니다. 그가 나와 같은 날에 방문하면 그를 볼 수 있습니다. 내가 거기있는 시간의 90 %가 있다고 가정 해 봅시다. 두 가지를 알고 싶습니다.

1) 얼마나 자주 훈련

2) 그가 무작위로 또는 주중에 정해진 날짜에 올지 여부.

아마 우리는 다른 하나를 추측하기 위해 하나를 가정해야 할 것 같아요? 나는 이것으로 전혀 아무 것도 얻지 못했습니다. 나는 매주 워밍업에서 그것에 대해 생각하고 당황합니다. 누군가 나에게 문제에 대해 생각할 수있는 방법을 주었더라도 가장 감사 할 것입니다.

건배!


1
@Chris, 모델을 정의하여 시작해야합니다. 일주일에 두 번 무작위로 방문한다고 말하면 많은 것을 의미 할 수 있습니다. 예를 들어, 매주 정확히 두 번 갈 수 있으며 세트의 두 요소를 임의로 조합하여 선택합니다.{,,}또는 일주일에 두 번 평균 머리가 2/5의 확률로 편향 동전을 뒤집고 매일 머리를 볼 수 있습니다. 이것 만이 유일한 옵션은 아닙니다.
추기경

또한 같은 날 도조를 방문하면 항상 그를 볼 것이라고 가정합니까? 그렇지 않다면, 우리는 당신의 세션의 길이와 그의 세션의 길이에 대해 매일 dojo가 열려있는 시간의 길이에 대해 알아야 할 것 같습니다.
onestop

1
@Chris, @onestop,이 질문은 종종 긍정적으로 대답하는 사회적 낙인으로 인해 진실하게 질문에 대답하기를 꺼려 할 수있는 사람들을 샘플링하는 데 사용되는 기술을 상기시킵니다. 응답자가 실제로 부정적으로 응답했을지라도 응답자가 상당히 높은 확률로 응답자가 긍정적으로 (보다 부끄러운 대답) 응답하도록 무작위 요소를 샘플링에 도입합니다. 임의로 결정된 "예"의 확률이 충분히 높으면, "자기 편향"이 감소된다. 물론 더 많은 사람들을 샘플링해야합니다.
추기경

1
@Chris 당신은 더 많은 가정을해야 할 것입니다. 이제는 여러 가지 유효한 설명이 있습니다. 바보 같은 것이 있습니다 : 개인의 방문은 당신과 독립적입니까? 그렇지 않은 경우, 그는 방문 할 때만 방문 할 것입니다 (매일 밖에서 차를 찾으십시오). 내부에 갈 것인지 결정하기 전에 동전 (확률 0.9)을 던지십시오.
vqv

1
간단한 해결책 : 물어보십시오 :-).
whuber

답변:


5

귀하의 데이터는 Hansen-Hurwitz 또는 Horvitz-Thompson 추정기 를 통해 부분적인 답변을 제공 합니다.

모델은 다음과 같습니다.이 개인의 출석을 일련의 지표 (0/1) 변수로 나타냅니다. (나는), 나는=1,2,. 매주 블록에서 두 요소 하위 집합을 무작위로 관찰합니다.(5케이+1,5케이+2,,5케이+5). (이것은 체계적인 샘플링의 한 형태입니다.)

  1. 그는 얼마나 자주 훈련 합니까? 주간 평균을 추정하려고합니다.나는. 수집 한 통계는 평균 관측치가 0.9임을 나타냅니다. 이것이 수집되었다고 가정 해 봅시다주. 그런 다음 개인 방문의 총 횟수에 대한 Horvitz-Thompson 추정기는 다음과 같습니다.나는π나는 = 52나는 = 52(2)0.9 = 4.5 (어디 π나는 관찰의 기회입니다 나는합계는 실제 관측치보다 높습니다.) 즉, 주당 4.5 일 훈련하는 것으로 추정해야합니다. 이 추정치의 표준 오차를 계산하는 방법에 대한 참조를 참조하십시오. 매우 좋은 근사값으로 일반적인 (이항식) 공식을 사용할 수 있습니다.

  2. 그는 무작위로 훈련합니까 ? 말할 방법이 없습니다. 요일별로 총계를 유지해야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.