저의 이탈리아 아들이 초등학교에 다닐 것이라는 사실로 인해 수업에 참석할 이탈리아 어린이의 수가 변경됩니까?


37

이것은 실제 상황에서 비롯된 질문이며, 그 답변에 대해 정말로 당황했습니다.

아들은 런던에서 초등학교를 시작할 예정입니다. 우리가 이탈리아 인이기 때문에 나는 얼마나 많은 이탈리아 어린이들이 이미 학교에 다니고 있는지 궁금했습니다. 나는 신청하는 동안 입학 담당관에게 이것을 물었고, 그녀는 그들이 수업 당 평균 2 명의 이탈리아 어린이 (30 명)를 가지고 있다고 말했다.

나는 지금 내 자녀가 받아 들여 졌음을 알고있는 시점에 있지만 다른 자녀들에 대한 다른 정보는 없습니다. 입학 기준은 거리를 기준으로하지만이 질문의 목적 상, 많은 지원자들의 무작위 배정에 근거한다고 가정 할 수 있습니다.

내 아들 반에는 몇 명의 이탈리아 어린이가있을 것으로 예상됩니까? 2 또는 3에 더 가깝습니까?


39
"나는 여행 할 때 항상 폭탄을 가지고 다닌다. 사람이 같은 비행기에 폭탄을 가지고 있을 가능성이 있기 때문이다 ."
Bill the Lizard

2
입학 담당관은 수업 당 평균 2 명의 이탈리아 어린이를 보유하고 있다고 말하면서이 데이터를 '의심스러운'것으로 만듭니다. 실제 계산에서 비롯된 경우 라운드가 아닌 숫자를 예상했을 것입니다. 따라서 실제 값이 1.51 또는 2.49 일 수 있습니다. 또한 입학 담당관은 그들의 답변으로 '당신을 기쁘게 해주려고'노력할 가능성이 높기 때문에, 다른 이탈리아 인들 사이에서 자녀를 기뻐할 것이라고 생각한다면, 반올림하지 않고 반올림했을 가능성이 있습니다. 2 근처의 값에 대한 분포는 비대칭 적입니다. 아래 답변을 조정할 수 있습니다.
PatrickT

4
@PatrickT "Mode"는 유효한 평균 유형입니다.
Ian Ringrose

1
답변 해 주셔서 감사합니다. 나는 또한 비슷한 질문을 게시했지만 일부 입력 / 답변에 의해 트리거 된 다른 프레임 ( stats.stackexchange.com/questions/173969/… )으로 게시했습니다 .
user90213

1
@ 패트릭 (PatrickT) 과도한 반올림에 대해 화가 난 통계 멍청이보다 1.5 ( "어떻게 반 아이가 있습니까?")보다 혼란스러워하는 교육받은 사람들이 훨씬 많을 것이라고 생각합니다. (더 정확한 숫자는 실제로 1.9 또는 2.1이 아니라고 가정합니다.)
Dan Neely

답변:


27

항상 그렇듯이 학교가 아이들을 학급 사이에 배분하는 방법을 설명하는 확률 모델을 고려해야합니다. 가능성 :

  1. 학교는 모든 수업에 같은 수의 외국인이 있는지 돌 봅니다.
  2. 학교는 심지어 각 국적이 모든 수업에서 거의 동일하게 표현되도록 노력합니다.
  3. 학교는 국적을 전혀 고려하지 않고 무작위로 또는 다른 기준에 따라 배포합니다.

이 모든 것이 합리적입니다. 전략 2가 주어지면 귀하의 질문에 대한 대답은 아니오입니다. 그들이 전략 3을 사용할 때 기대치는 3에 가까워 지지만 조금 더 작아 질 것입니다. 그것은 당신의 아들이 "슬롯"을 차지하기 때문에 당신은 임의의 이탈리아 인에 대한 기회가 하나 더 적기 때문입니다.

학교가 전략 1을 사용할 때 기대치도 올라갑니다. 학급당 외국인 수에 따라 달라집니다.

학교를 알지 못하면 더 완벽하게 대답 할 방법이 없습니다. 연간 수업이 하나만 있고 입학 기준이 설명 된대로 정답은 위의 3과 동일합니다.

3에 대한 세부 계산 :

E(X)=1+E(B(29,2/30))=1+1.9333=2.9333.

X는 수업에서 이탈리아 어린이의 수입니다. 1은 알려진 어린이에게서오고 29는 나머지 수업이며 2/30은 학교에서 말한 것을 알 수없는 아이가 이탈리아어 일 확률입니다. B는 이항 분포입니다.

시작 하면 특정 자녀가 이탈리아어임을 알면 이항 분포에 의해 가정 된 교환 가능성에 위배되므로 적절한 대답을 제공하지 않습니다. 이것을 소년 또는 소녀 역설 과 비교하십시오 . 여기서 한 아이가 소녀라는 것을 아는 것과 큰 아이가 소녀라는 것을 아는 것이 차이가 있습니다.E(X|X1)


2
이항 가정을하고 봅시다 . 과 사이의 선택 은 가정에 따라 달라질 수 있습니다. 예를 들어, 런던의 이탈리아 아버지가 @ user90213만큼 당황 할 가능성이 높다고 가정하고 여기에 질문을 게시하려고한다면이 질문 하나를 보더라도 내 기대가 크게 바뀌지 않습니다. 나는 한 아이가 이탈리아어라는 것을 배웠고 계산할 것 입니다. 당신이 "교환 성"이라고 불렀습니까? 반면에 user90213이 내 친한 친구이고 그의 아들을 알고 있다면, 나는 당신의 대답에 도달 할 것입니다. n=30E(XB(30,2/30)|X1)E(B(29,2/30))E(X|X1)
amoeba는 Reinstate Monica

2
@amoeba 특정 학교와 특정 수업에 user90213의 아이가 그를 다른 학생들과 구별하기에 충분하다는 것을 알면 그것은 user90213과의 관계가 얼마나 특별한 지에 달려 있지 않습니다. 그러나 정보를 배우는 방법이 중요하다는 점에서 까다 롭습니다. 예를 들어, 학급에서 가장 오래된 이탈리아 어린이가 이름으로 연락을한다고 이메일로 요청하고 답장을 받으면 나중에 아이를 구별 할 수 있더라도 접근 방식을 사용합니다. 소녀 소년 역설에 대한 인터넷 검색을 시도하거나 더 일반적인 질문을하십시오. 그것에 대해 많은 토론이 있습니다. E(X|X>1)
Erik

그렇습니다, 에릭 감사합니다. 이전 의견에서 의미 한 바는 이메일 예제와 비슷한 것입니다. 수업 시간에 모든 이탈리아 부모가 여기에 질문을 게시한다고 가정하면이 질문을 보는 것은 가장 오래된 이탈리아 어린이가 연락하는 것과 같습니다. 우리는 일반적으로 +1 인 것으로 보인다. 위키 링크는 정말 흥미 롭습니다.
amoeba는 Reinstate Monica

(+1)하지만 왜 "년에 수업이 하나 밖에 없다면 ...]
Scortchi-Monica Monica 복원

@Scortchi 학교에 연간 수업이 하나 뿐인 경우, 올해 학교에 입학하는 모든 어린이는 같은 수업에 참여하므로 1과 2로 표시된 두 가지 전략을 사용할 수 있습니다.
에릭

13

이것을 보는 또 다른 방법은 개별 어린이의 수준에 있습니다. 모집단에서 무작위로 30 명의 어린이를 뽑았다 고 가정하면 (우리가 할 수 있음을 나타냄),이 인구에서 이탈리아 어린이가 확률로 거슬러 올라갈 수 있습니다 : = .2/301/15

30 개 중 하나가 이탈리아 인이라는 것을 알면 나머지 어린이의 확률 만 계산하면됩니다.

291/15=29/15=1.933

따라서 자녀가 이탈리아어임을 알면 수업에서 예상되는 이탈리아 어린이 수가 약 2.933으로 변경되어 2보다 3에 훨씬 가깝습니다.


5

여기에 접근하는 방법에 대한 내 생각은 다음과 같습니다.

무작위 변수 이 현재 크기가 클래스의 이탈리아어 자식 수를 나타냅니다 . 하자 새로운 아이의 이탈리아 인의 지표가 될 수. 이 클래스에 하위 를 추가한다고 가정하십시오 . 그런 다음이 크기의 확장 클래스에서 예상되는 이탈리아 어린이 수 는 입니다. 우리는 기대의 선형성을 사용하기 때문에 독립성은 중요하지 않습니다. 자식 가 이탈리아어 인 경우 확률이 1 인 1이므로 예상 값이 1 증가했습니다.SnnXXn+1E(Sn+X)=E(Sn)+E(X)=E(Sn)+P(X=1)XX=1


1
그래서 거기에있을거야 이탈리아의 아이를 첨가 한 후,이 클래스의 아이? n+1
Scortchi-Monica Monica 복원

예. 내가 놓친 것이 있습니까?
jld

1
질문을 읽는 방법에 따라 다릅니다. 수업이 정확히 30 명의 어린이라고 가정합니다.
Scortchi-Monica Monica 복원

1
어쩌면 나는 그 질문을 오해했을 것입니다. 나는 알려진 이탈리아 어린이의 추가가 어떻게 기대를 바꾸는 지에 대해 물었다 고 생각했다.
jld

1
이것은 클래스 규모에 대한 좋은 지적입니다
jld

1

Admission Office 정보에 따르면 독립성을 가정하면 이탈리아 어린이 수는 이항 따릅니다 . 이제 여러분은 수업에 적어도 하나의 이탈리아 어린이가 있으므로 기대는 됩니다. 를 들어 ,이 평가됩니다 (내 계산 권리를받을 경우).Binom(30,2/30)E(X|X1)XBinom(30,2/30)2.28


편집하다. 기대치 평가 :

E[X|X1]=i=030iP(X=i|X1)=030iP(X=i,X1)P(X1)=130iP(i)1P(0)

(마지막 단계에서 합계 하한의 변화에 ​​유의하십시오)


1
조건부 기대에 대해 자세히 설명 할 수 있습니까?
Antoni Parellada

3
대답이 틀립니다. 이것을 계산하는 올바른 방법은 1 (알려진 자식) + E (B (29, 2/30))로 2.9333으로 나타납니다. 그리고 이항 분포의 가정은 의문의 여지가 있습니다.
Erik

내가 지적하고 싶은 한 가지 더 : a) 조건부 기대 값 계산이 잘못되었습니다. 그러나 b) 더 중요한 것은 조건부 기대로 시작하는 것이 잘못되었습니다. 특정 어린이가 이탈리아 인이라는 사실을 알면 이중 정규 분포에 의해 가정 된 교환 성이 깨집니다. 그것은 소년 소녀 역설 ( en.wikipedia.org/wiki/Boy_or_Girl_paradox ) 과 매우 유사합니다 .
Erik

스크래치 코멘트 a) 위에서. 그러나 b) 어쨌든 더 심각하다;)
Erik

동의한다. OP의 경우 분포는 더 이상 이항식 (30, 2/30)이 아니라 실제로 1+ 이항식 (29, 2/30)
jf328

-3

임박한 행사에 대한 지식은 학교의 전형적인 경험에 영향을 미치지 않습니다.


2
-1. 여기에 다른 답변과 의견에 자세히 설명 된 것처럼 잘못되었습니다.
amoeba는 Reinstate Monica

고급 수학의 부족을 용서하십시오. 그러나이 신사의 자녀가 '전형적으로 2 명의 자녀'중 하나가 아닌 이유는 무엇입니까? .. 따라서 우리는 3에 가까워집니다.
Mart


마트 : 내가 동전을 10 번 던지고 머리를 세 었다고 상상해보십시오. 동전이나 내가 던지는 방식에 대해 이상하지 않습니다. 나는 그 실험을 여러 번 반복하고 평균적으로 나는 10 번의 토스에서 거의 정확히 5 개의 머리를 본다. 어떤 결과가 나올지 (공정한 동전 던지기 절차에 대한 예상 변동 내에서 1000 토스, 50.3 %가 머리를 차지했습니다. 우리는 그 과정이 적어도 실질적으로 공정한 것으로 판단합니다). 이제 한 번 더 실험을했는데 처음 4 번의 토스가 모두 머리임을 알 수 있습니다. 전체 10 번의 토스 세트에서 예상되는 헤드 수는 얼마입니까? 5? 더?
Glen_b

앞의 주장에 따르면 처음 네 개는 "예상 다섯 개 중 네 개일 수 있습니다"라는 점에 유의하십시오. 그러나 다음 6 번의 토스에서 50 % 미만의 확률이 있다고합니다 (실제로 평균 1/6의 확률 만 있음). 동전이 머리를 덜 자주 찾는다는 것을 어떻게 알 수 있습니까?
Glen_b
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.