이 사람이 여성 일 확률은 얼마입니까?


32

커튼 뒤에 사람이 있습니다-사람이 여성인지 남성인지 모르겠습니다.

나는 사람의 머리카락이 길고 머리카락이 긴 모든 사람의 90 %가 여성이라는 것을 알고 있습니다.

나는 그 사람이 희귀 혈액형 AX3을 가지고 있으며이 혈액형을 가진 모든 사람들의 80 %가 여성이라는 것을 알고 있습니다.

그 사람이 여성 일 확률은 얼마입니까?

참고 :이 원래 공식은 두 가지 추가 가정으로 확장되었습니다. 1. 혈액형과 모발 길이는 독립적입니다.

(여기서 구체적인 시나리오는 그다지 관련성이 없습니다. 오히려이 질문에 대답하기위한 올바른 접근 방식을 생각해야하는 긴급한 프로젝트가 있습니다. 내 직감은 단순한 결정적인 대답이있는 단순한 확률의 문제라는 것입니다. 다른 통계 이론에 따라 여러 가지 논쟁의 여지가있는 것보다.)


1
확률에 대한 여러 가지 이론은 없지만 사람들이 확률에 대해 올바르게 생각하는 데 어려움이 있다는 것은 사실입니다. (좋은 수학자 인 Auugustus DeMorgan은 어려움으로 인해 확률에 대한 연구를 포기했다.) 논쟁을 보지 말고 : 확률의 원칙 (콜 모고 로프 공리와 같은)에 대한 호소를 찾는다. 이 문제를 민주적으로 해결하지 마십시오. 귀하의 질문은 잘못 이해 된 많은 답변을 끌어 들이고 있습니다. @Michael C는 좋은 지침을 제공합니다. 내 대답은 그가 옳은 이유를 보여 주려고합니다.
whuber

@Whuber, 독립성을 가정하면 0.97297이 정답이라는 데 동의하십니까? (나는이 가정없이 대답이 0 %에서 100 % 사이에 있다고 생각합니다-다이어그램이 잘 보여줍니다).
아마 잘못된

정확히 무엇입니까? 여성과 남성의 헤어 스타일이 동일하다는 것을 제안하고 있습니까? 귀하의 질문에서 알 수 있듯이 성별 / 머리카락 / 혈액형과 관련된이 특정 시나리오는 적합하지 않을 수 있습니다. 일반적으로 이와 같은 문제를 해결하는 방법을 이해하려고합니다. 그러기 위해서는 어떤 가정이 어떤 결론을 내포하는지 알아야합니다. 그러므로 당신은 당신이 기꺼이 내릴 수있는 가정에 매우 신중하게 집중하고 그들이 당신이 결론을 내릴 수있는 양을 정확하게 결정해야합니다.
whuber

3
탐구하는 독립의 종류는 세 가지 특성의 조합에 관한 것입니다. 예를 들어, AX3가 여성의 대머리를 포함하는 증후군 (남성 제외)의 마커 인 경우 AX3를 가진 긴 머리의 사람은 반드시 남성이므로 97.3 %가 아닌 0 %가 될 확률이 높습니다. 이 질문에 대한 명확한 답을 제시하는 사람 은 명시 적으로 인정하지 않더라도 추가적인 가정을 해야 한다는 것이 분명해지기를 바랍니다 . 실제로 유용한 답변 IMHO는 다른 가정이 어떻게 다른 결과를 가져 오는지를 직접 보여주는 답변입니다.
whuber

2
여성의 머리카락이 길지 않을 가능성 이 없습니다 . 그것은 중요한 척도입니다.
Daniel R

답변:


35

많은 사람들이 "인구", 그 안의 하위 그룹 및 비율 (확률이 아닌)의 관점에서 생각하는 것이 도움이된다고 생각 합니다. 이것은 시각적 추론에 적합합니다.

나는 그림을 자세히 설명 할 것이지만, 두 그림의 빠른 비교는 질문에 대한 구체적인 대답을 제시 할 수없는 방법과 이유를 즉각적이고 확실하게 나타내야한다는 것입니다. 약간 더 긴 시험은 답변을 결정하거나 적어도 답변에 대한 한계를 얻는 데 유용한 추가 정보가 무엇인지 제안합니다.

벤 다이어그램

전설

크로스 해칭 : 여성 / 단색 배경 : 남성.

: 장발 / 아랫면 : 단발.

오른쪽 (색) : AX3 / 왼쪽 (색) : 비 AX3.

데이터

상단 교차 해칭은 상단 사각형의 90 %입니다 ( "긴 머리를 가진 모든 사람의 90 %는 여성").

오른쪽 색 사각형의 총 크로스 해칭은 해당 사각형의 80 %입니다 ( "이 혈액형을 가진 모든 사람의 80 %는 여성입니다").

설명

이 다이어그램은 인구 (고려중인 모든 여성 및 비 여성)의 인구를 여성 / 여성 비 여성, AX3 / 비 -AX3 및 긴 머리 / 비긴 머리 ( "짧은")로 동시에 분할하는 방법을 개략적으로 보여줍니다. 면적을 적어도 대략적으로 사용하여 비율을 나타냅니다 (그림을 더 선명하게하기 위해 과장된 부분이 있습니다).

이 세 가지 이진 분류는 8 개의 가능한 그룹을 만드는 것이 분명합니다. 각 그룹이 여기에 나타납니다.

주어진 정보는 상단 십자형 사각형 (긴 머리 여성)이 상단 사각형 (모든 긴 머리 사람)의 90 %를 구성한다는 것을 나타냅니다. 또한 색이 지정된 사각형 (AX3이있는 장발 암컷과 AX3이있는 단발 암컷)의 교차 십자 부분이 오른쪽에있는 색 영역의 80 % (AX3을 가진 모든 사람)를 구성한다고 명시되어 있습니다. 우리는 누군가가 AX3을 가진 긴 머리 사람들 오른쪽 상단 모서리 (화살표)에 있다고 들었습니다. 이 직사각형의 어느 부분이 크로스 해칭 (여성)입니까?

또한 혈액 유형과 머리카락 길이가 독립적 이라고 가정했습니다 . 색상이 표시된 위쪽 사각형 (긴 머리)의 비율 (AX3)은 색이 지정된 아래쪽 사각형 (짧은 머리)의 비율과 같습니다 (AX3). 이것이 독립성을 의미합니다. 이와 같은 질문을 처리 할 때 만드는 것은 공정하고 자연스러운 가정이지만 물론 언급해야합니다.

상단 십자형 사각형 (긴 머리 암컷)의 위치는 알려져 있지 않습니다. 상단 교차 해치 사각형을 좌우로 슬라이딩하고 하단 교차 해칭 사각형을 좌우로 슬라이딩하고 너비를 변경하는 것을 상상할 수 있습니다. 만약 우리가 색 사각형의 80 %가 크로스 해칭을 유지하도록 그렇게한다면, 그러한 변경은 명시된 정보를 전혀 바꾸지 않을 것이지만, 오른쪽 위 사각형의 암컷 비율을 바꿀 수 있습니다. 분명히이 비율은 0 %에서 100 % 사이 일 수 있으며이 이미지와 같이 주어진 정보와 여전히 일치 할 수 있습니다.

그림 2


이 방법의 장점 중 하나 는 질문에 대한 여러 답변이 존재한다는 것입니다. 이 모든 것을 대수적으로 번역 할 수 있으며 확률을 규정하여 특정 상황을 가능한 예로 제시 할 수 있지만 그러한 예가 실제로 데이터와 일치하는지에 대한 의문이 생길 수 있습니다. 예를 들어, 장발 사람들의 50 %가 AX3이라고 제안하는 사람이 있었을 때 처음부터 가능한 모든 정보를 감안할 때 이것이 가능하다는 것은 분명하지 않습니다. 인구와 하위 그룹에 대한이 (벤) 다이어그램은 그러한 것들을 명확하게합니다.


3
Whuber는 혈액형과 모발 길이가 독립적이라고 가정하면 AX3 유형의 장발 여성의 부분이 AX3의 단발 여성의 부분과 동일해야합니까? 즉, 제안한 방식으로 사각형을 이동할 수있는 유연성이 없습니다 ... 전체 인구에서 남성과 여성이 50:50이라고 가정하면 단일 질문으로이 질문을 해결할 충분한 정보를 얻지 못합니다. 확실한 대답?
아마 잘못된

@ whuber +1은 아주 좋습니다.
Michael R. Chernick 2016 년

5
아마도 잘못된 점은 귀하의 의견에 대한 질문을 면밀히 살펴보십시오. 여성 을 다루기 때문에 성별에 대한 조건부 독립성 에 대한 추가 가정을 만들고 있습니다. 모발과 혈액 유형의 (무조건적) 독립에 대한 가정은 성별을 전혀 언급하지 않으므로 의미를 이해 하려면 그림에서 크로스 해칭을 지우십시오. 희망, 이것은 우리가 위아래 직사각형 내에서 원하는 곳 어디에서나 크로스 해칭을 배치 할 수있는 유연성을 갖는 이유를 나타냅니다.
whuber

1
@ whuber, 나는 이것을 좋아한다. 그러나 나는 두 가지 질문 / 설명이 있습니다. 그림에 대한 설명에서 논의되지 않았습니다. 나는 팝 비율이 관련이 없다고 생각합니다. 내가 맞습니까 / 설명에서 그것을 분명히 할 수 있습니까? 2. 나는이 상황이 궁극적으로 심슨의 역설 과 같은 현상으로 작동한다고 생각한다. 다른 프레임에서만 (다른 방향에서 문제가 발생했을 때). 이것이 공정한 평가입니까?
gung-모니 티 복원

3
@ gung, 그 설명을 해 주셔서 감사합니다. 물론 수치는 있어야 전혀 작동하려면 일부 비율을 나타내지 만 특히 문제 문에서 아래로 고정되지 않은 비율은 차이가 무료입니다. (나는 인구의 약 50 %가 여성으로 보이도록 추후에 편집 한 것을 예상하여 그림을 구성했다.) 심슨의 역설을 이해하기 위해이 그래픽 표현을 적용한다는 아이디어는 흥미 롭다. 장점이 있다고 생각합니다.
whuber

13

이것은 조건부 확률의 문제입니다. 당신은 사람이 긴 머리카락과 혈액형 Ax3을 가지고 있음을 알고 있습니다. 하자 따라서 를 찾습니다 . 및 이라는 것을 알고 있습니다. 를 계산하기에 충분 합니까? 가정 . 그런 다음 이라고 가정하십시오 . 그런 다음 위의 방법으로P ( C | A B ) P ( C | A ) = 0.9 P ( C | B ) = 0.8 P ( C | A B ) P ( A B C ) = 0.7 P ( C | A B ) = P

     에이={'사람은 긴 머리를 가지고있다'}              ={'사람은 혈액형 Ax3을 가지고 있습니다'}기음={'사람은 여자입니다'}.

P(C|A and B)P(C|A)=0.9P(C|B)=0.8
P(C|A and B)P(A and B and C)=0.7P ( A B ) = 0.8 P ( C | A B ) = 0.875 P ( A B ) = 0.9 P ( C | A B )
P(C|A and B)=P(A and B and C)/P(A and B)=0.7/P(A and B).
P(A and B)=0.8P(C|A and B)=0.875 입니다. 반면에 이면 = 0.78이됩니다.P(A and B)=0.9P(C|A and B)

이제 및 때 둘 다 가능합니다 . 따라서 가 무엇인지 확실하게 알 수 없습니다 .P ( C | B ) = 0.8 P ( C | A B )P(C|A)=0.9P(C|B)=0.8P(C|A and B)


안녕 마이클, 내가 당신을 올바르게 읽으면, 당신은 제기 된 질문에 대답 할 수 없다고 말하는 것입니다, 맞습니까? 또는 다른 방식으로 말하면이 질문에 대답하기 위해 더 많은 정보가 필요합니까? 1. 나의 원래 질문에서 희귀 혈액형이 사람의 머리를 길게 자라는 욕구 나 능력에 영향을 미치지 않는다고 가정 해 봅시다. 이제 질문에 대답 할 수 있습니까? 2. 답변이 0.9보다 커야한다는 데 동의하십니까? (당신은 그 사람이 여성이라는 가설을 강화하는 두 번째 독립적 인 정보 (혈액 유형)를 가지고 있기 때문에)
아마도 잘못된

2
경우 입니다 독립 후, 당신은 사람의 비율, 즉 긴 머리를 가지고있는 지정해야합니다 , 및 혈액형 Ax3을 가진 사람의 몇 분율, 즉 . 또한 대답이 0.9보다 커야한다고 말할 수는 없습니다. 이는 (정확히 이유를 알 수 없음)라고 말하는 것과 같습니다 . P ( A  및  B ) = P ( A ) P ( B ) P ( A ) P ( B ) P ( C | A  및  B ) > 0.9P(A and B)P(A and B)=P(A)P(B)P(A)P(B)P(C|A and B)>0.9
Néstor

2
@ 아마도 틀렸다. 그렇습니다. 처음에 언급 된 문제에는 고유 한 답변에 대한 정보가 충분하지 않습니다.
Michael R. Chernick 2016 년

@ Néstor, Micahael, 나는 우리가 어떤 사람의 머리카락이 긴지, 어떤 사람의 혈액형이 AX3인지 알아야한다는 것에 동의하지 않습니다. 나는 원래의 질문에 대한 대답이 이것들을 알지 못하고 독특하게 해결된다고 생각합니다 (A와 B가 독립적이며 우리 모두가 가지고 있다고 가정하고 전체 인구에서 남녀의 분열을 알고 있다고 가정하면 약 50:50이라고 가정하는 것은 무리가 없습니다) 생각합니다).
아마 잘못된

7
나는 P ( C | A B ) = P ( C ( A thought B ) )
(기음|에이  )=(에이    기음)×(에이  )??
조건부 확률의 정의를 사용하여 P ( A B ) .
P(C|AB)=P(C(AB))P(AB)=P(ABC)P(AB)
Dilip Sarwate

4

매혹적인 토론! P (A)와 P (B)를 지정했는지 여부와 P (C | A, B)의 범위가 전체 제약 [0,1]보다 훨씬 좁지 않을지 궁금합니다. 우리는.

위에서 소개 한 표기법을 고수하십시오.

A = 사람이 긴 머리를 가진 사건

B = 사람이 혈액형 AX3을 갖는 경우

C = 사람이 여성 인 경우

P (C | A) = 0.9

P (C | B) = 0.8

P (C) = 0.5 (즉, 전체 인구에서 남녀 비율이 같다고 가정하자)

이벤트 A와 B가 C를 조건부로 독립적이라고 가정하는 것은 불가능합니다! 즉 모순 직접 이어진다 경우 P(AB|C)=P(A|C)P(B|C)=P(C|A)P(A)P(C)P(C|B)P(B)P(C)

그때

P(C|AB)=P(AB|C)(P(C)P(AB))=P(C|A)P(A)P(C)P(C|B)P(B)P(C)(P(C)P(AB))

이제 A와 B가 독립적이라고 가정하면 대부분의 용어가 취소되고P(AB)=P(A)P(B)

P(C|AB)=P(C|A)P(C|B)P(C)=0.90.80.5>1

문제에 대한 whuber의 멋진 기하학적 표현에 대한 후속 조치 : 일반적으로 말하면 는 간격 [ 0 , 1 ] 에서 임의의 값을 가정 할 수 있다는 것이 사실이지만 기하학적 구속 조건은 가능한 값의 범위를 크게 좁 힙니다. "너무 작지 않은" P ( A )P ( B )의 값 . (우리는 또한 한계를 상한으로 할 수 있습니다 : P ( A )P ( B ) )P(C|AB)[0,1]P(A)P(B)P(A)P(B)

다음 기하학적 제약 조건 에서 에 대한 {\ bf smallest possible value}를 계산해 보겠습니다 .P(C|AB)

1. 상단 사각형으로 덮힌 상단 영역의 비율 (A TRUE)은 P ( C | A ) = 0.9와 같아야합니다.P(C|A)=0.9

2. 두 직사각형의 면적의 합은 P ( C ) = 0.5와 같아야합니다.P(C)=0.5

3. 두 색 사각형의 면적 비율 (즉, 이벤트 B와 겹침)의 합은 P ( C | B ) = 0.8 과 같아야합니다.P(C|B)=0.8

4. (사소한) 위 사각형은 왼쪽 경계를 넘어서 이동할 수 없으며 왼쪽의 최소 겹침을 넘어서는 안됩니다.

5. (사소한) 아래쪽 사각형은 오른쪽 경계를 넘어서 이동할 수 없으며 오른쪽의 최대 겹침을 넘어서는 안됩니다.

이러한 제약 자유롭게 우리는 해시 사각형을 밀어 다시 낮은 경계 생성 할 수있는 방법을 제한 . 아래 그림 (이 R 스크립트로 작성 )은 두 가지 예를 보여줍니다. P(C|AB)여기에 이미지 설명을 입력하십시오

P (A) 및 P (B) ( R script )에 대해 가능한 값 범위를 실행 하면이 그래프가 생성됩니다. 여기에 이미지 설명을 입력하십시오

결론적으로, 주어진 P (A), P (B)에 대한 조건부 확률 P (c | A, B)를 하한으로 낮출 수 있습니다


2
A,B,C

1
@ whuber : 유용한 의견 주셔서 감사합니다! 새로운 수정 사항이 더 읽기 쉽고 명확 해지기를 바랍니다.
Markus Loecher

@ whuber 및 기타 : 토론을 다시 시작하기를 희망했지만 스레드가 비활성화 된 것 같습니다. 더 이상 댓글이 없습니다.
Markus Loecher

1

커튼 뒤에있는 사람은 여자라는 가설을 세우십시오.

우리는 두 가지 증거, 즉 :

증거 1 : 사람의 머리카락이 길다는 것을 알고 있습니다 (그리고 머리카락이 긴 모든 사람의 90 %가 여성이라고 들었습니다)

증거 2 : 우리는 그 사람이 희귀 한 혈액형 AX3을 가지고 있다는 것을 알고 있습니다 (그리고 우리는이 혈액형을 가진 모든 사람의 80 %가 여성이라고 들었습니다)

증거 1 만 제시하면 커튼 뒤에있는 사람이 여성 일 가능성이 0.9 일 가능성이 있다고 말할 수 있습니다 (남성과 여성이 50:50으로 가정).

스레드의 앞부분에서 제기 된 질문, 즉 "답이 0.9보다 커야한다는 데 동의하겠습니까?"라는 수학에 대해 직관적으로 말하면 대답은 "예"(0.9보다 큼) 여야합니다. 논리는 증거 2가 증거를 뒷받침한다는 것입니다 (세계의 남녀 수에 대한 50:50 분할 가정). AX3 형 혈액을 가진 모든 사람의 50 %가 여성이라고 들었다면, 증거 2는 중립적이며 아무런 관련이 없습니다. 그러나 우리는이 혈액형을 가진 모든 사람들의 80 %가 여성이라고 들었습니다. 증거 2는 증거를지지하고 논리적으로 여성의 최종 확률을 0.9 이상으로 밀어야합니다.

특정 확률을 계산하기 위해 증거 1에 베이 즈 규칙을 적용한 다음 베이지안 업데이트를 사용하여 증거 2를 새로운 가설에 적용 할 수 있습니다.

다음을 가정하십시오.

A = 사람이 긴 머리를 가진 사건

B = 사람이 혈액형 AX3을 갖는 경우

C = 사람이 여성 인 경우 (50 % 가정)

증거 1에 베이 즈 규칙 적용 :

P (C | A) = (P (A | C) * P (C)) / P (A)

이 경우에 우리가 남성과 여성 사이의 50:50 분할을 가정하면 다음과 같습니다.

P (A) = (0.5 * 0.9) + (0.5 * 0.1) = 0.5

따라서 P (C | A) = (0.9 * 0.5) / 0.5 = 0.9 (놀랍지는 않지만, 남성과 여성 사이에 50:50 분할이 없다면 다를 것입니다)

베이지안 업데이트를 사용하여 증거 2를 적용하고 0.9를 새 사전 확률로 연결하면 다음과 같은 이점이 있습니다.

P (C | A AND B) = (P (B | C) * 0.9) / P (E)

여기에서, P (E)는 그 사람이 이미 여성 일 확률이 90 %라는 가설을 감안할 때 증거 2의 확률입니다.

P (E) = (0.9 * 0.8) + (0.1 * 0.2) [이것은 총 확률의 법칙입니다 : (P (woman) * P (AX3 | woman) + P (man) * P (AX3 | man)] So , P (E) = 0.74

따라서 P (C | A AND B) = (0.8 * 0.9) / 0.74 = 0.97297


1
답이 나에게 이해되지 않는 몇 가지 진술이 있습니다. (1) 가정에 의한 P (C | A) = 0.9. P (C) = 0.9라는 말은 어디에도 없었다. P (C) = 0.5라고 가정했습니다. (2) P (E) 결과는 어떻게 얻었습니까? P (woman) = 0.9라고 쓰는 가정에 의해 P (woman) = P (man) = 0.5입니다.
Michael R. Chernick 2016 년

P (C)의 값은 0.5로 가정합니다. 이것은 내가 사용한 것입니다. P (E)의 값은 증거 1을 적용한 후 증거 2의 확률입니다 (이는 사람이 여성 일 확률이 0.9라는 새로운 가설로 이어집니다). P (E) = (사람이 여성 일 확률 (지정된 Evience 1) * 여성 인 경우 사람이 AX3을 가질 확률) + (사람이 남성 일 가능성이있는 사람 (Evenence Evience 1)) * 사람이 AX3을 가질 확률 남자라면) = (0.9 * 0.8) + (0.1 * 0.2) = 0.74
RandomAnswer

E의 확률에 대한 당신의 정의는 약간 혼란스럽고 그것을 계산하기 위해 사용하는 용어는 이전에 쓴 것과 다르게 보입니다. 정말 중요하지 않습니다. 그 대답은 Huu의 정답을 바탕으로 정답입니다.
Michael R. Chernick

@Michael 허우가 실수를 저지른 것 외에는.
whuber

2
이 대답은 단순히 잘못되었습니다. 다른 오류가있을 수 있지만 눈부신 오류입니다. P ( "긴 머리가 있습니다") (P (A))에 대한 결정적인 답을 제시 한 다음이를 사용하여 최종 결정을 내립니다. P (F) = 0.5라고 가정하더라도이를 결정하기에 충분한 정보가 없습니다. P (A)를 계산하는 줄은 아무데도없는 것 같습니다. 베이 즈 정리를 사용한 올바른 공식은 다음과 같습니다. F) * 5 / 9. 그러나 우리는 여전히 P (A | F)를 모른다.
Bogdanovist 2016 년

0

질문 재 작성 및 일반화

ABC01ZiZi(X|Y)XY(Aa|BbCcI)

  1. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2
  2. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(BC|I)=(B|I)(C|I)
  3. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(A0|I)=12
  4. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(A0|I)=12(BC|I)=(B|I)(C|I)

I

(BjCk|I)=(Bj|I)(Ck|I),j=0,1k=0,1

대답

사례 1

(ABC|I)(ABC|I)

정보가 다른 방법으로 결정하지 않을 때 할당 할 분포가 알려진 정보와 일치하는 모든 분포 중에서 가장 큰 엔트로피를 갖는 것임을 다양한 난해한 수단으로 알 수 있습니다. 다른 배포판 은 알려진 정보보다 더 많은 정보를 알고 있음을 의미합니다 . 물론 모순입니다.

i,j,k(AiBjCk|I)ln(AiBjCk|I)
i,j,k(AiBjCk|I)=1
(Aa1|Bb1I)=u1i.e.k(Aa1Bb1Ck|I)i,k(AiBb1Ck|I)=u1
(Aa2|Cc2I)=u2i.e.j(Aa2BjCc2|I)i,j(AiBjCc2|I)=u2

  1. A1
  2. B1
  3. C1

a=1b=1c=1a1=1b1=1a2=1c2=1u1=0.9u2=0.8(A1|B1C1I)0.932. 따라서 커튼 뒤에있는 사람이 긴 머리카락과 혈액형 AX3을 가졌다 고 가정 할 때 여성 일 확률은 0.932입니다.

사례 2

BC

(B0|ClI)=(B0|I),l=0,1
i(AiB0Cl|I)i,j(AiBjCl|I)=i,k(AiB0Ck|I),l=0,1
(A1|B1C1I)0.936

사례 3

(A0|I)=12i.e.j,k(A0BjCk|I)=12
(A1|B1C1I)0.973

사례 4

(A1|B1C1I)0.989


-2

나는 우리가 전체 인구에서 남녀의 비율을 가정한다면, 명백한 대답이 하나 있다고 믿는다.

A = 사람이 긴 머리를 가진 사건

B = 사람이 혈액형 AX3을 갖는 경우

C = 사람이 여성 인 경우

P (C | A) = 0.9

P (C | B) = 0.8

P (C) = 0.5 (즉, 전체 인구에서 남녀 비율이 같다고 가정하자)

그런 다음 P (C | A 및 B) = [P (C | A) x P (C | B) / P (C)] / [[P (C | A) x P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]]

이 경우 P (C | A 및 B) = 0.972973


P [C | A 및 B) = P (A 및 B 및 C) / P (A 및 B) = P (A 및 B 및 C) / [P (A | B) P (B)]. 공식을 어떻게 얻었습니까?
Michael R. Chernick 2016 년

고유 한 답변을 얻을 수 있도록 조건을 추가하는 방법이있을 수 있습니다.
Michael R. Chernick 2016 년

A와 B의 독립성에 의해 공식은 P (A와 B와 C} / [P (A) P (B)] = P (B와 C | A) / P (B)로 단순화됩니다
Michael R. Chernick

2
내 질문의 의도는 실제로 수식을 정당화하는 것이 었습니다. 나는 그것이 어떻게 파생되는지 이해하지 못한다.
Michael R. Chernick 2016 년

2
아니요, Bayes Rule을 사용한 것으로 추정되는 답변이 올바르지 않습니다. 왜 당신이 혼란 스러울 지 모르겠습니다. 위의 MC 공식이 정확하고 결과를 얻는 데 사용할 수 없습니다. 즉, 질문에 대한 그의 Whuber의 답변이 설명했습니다!
Bogdanovist 2016 년

-2

참고 : 아래의 답변은 결정적인 답변을 얻기 위해 AX3를 가진 사람, 긴 머리 남자 및 긴 머리 여자의 확률이 거의 동일하다고 가정합니다. 더 많은 정확도가 필요한 경우이를 확인해야합니다.

당신은 사람이 긴 머리카락을 가지고 있다는 지식으로 시작 하므로이 시점에서 확률은 다음과 같습니다.

90:10

참고 : 사람이 긴 머리카락을 발견하면 일반 인구의 남성 대 여성의 비율은 중요하지 않습니다. 예를 들어, 일반 인구에서 백 명의 여성이 1 명인 경우 무작위로 선택한 장발 인은 여전히 ​​90 %의 여성이됩니다. 여성 대 남성의 비율은 중요합니다! (자세한 내용은 아래 업데이트 참조)

다음으로, 우리는 그 사람이 AX3을 가지고 있다는 것을 배웁니다. AX3는 긴 모발과 관련이 없기 때문에 남성 대 여성의 비율은 50:50으로 알려져 있으며, 확률이 동일하다는 가정하에 확률의 양쪽을 곱하고 정규화하여 확률의 측면은 100과 같습니다.

(90:10) * (80:20)
==> 7200:200

    Normalize by dividing each side by (7200+200)/100 = 74

==> 7200/74:200/74
==> 97.297.. : 2.702..

따라서 커튼 뒤에있는 사람이 여성 일 확률은 약 97.297 %입니다.

최신 정보

다음은 문제에 대한 추가 탐색입니다.

정의 :

f - number of females
m - number of males
fl - number of females with long hair
ml - number of males with long hair
fx - number of females with AX3
mx - number of males with AX3
flx - number of females with long hair and AX3
mlx - number of males with long hair and AX3
pfl - probability that a female has long hair
pml - probability that a male has long hair
pfx - probability that a female has AX3
pmx - probability that a male has AX3

먼저, 장발 인의 90 %가 여성이고 AX3를 가진 사람의 80 %가 여성이므로,

fl = 9 * ml
pfl = fl / f
pml = ml / m 
    = fl / (9 * m)

fx = 4 * mx
pfx = fx / f
pmx = mx / m 
    = fx / (4 * m)

AX3의 확률은 성별과 긴 모발과 무관하다고 가정했기 때문에 계산 된 pfx는 긴 모발을 가진 여성에게 적용되며 pmx는 긴 모발을 가진 남성에게 적용하여 AX3이있을 가능성이있는 여성의 수를 찾습니다.

flx = fl * pfx 
    = fl * (fx / f) 
    = (fl * fx) / f
mlx = ml * pmx 
    = (fl / 9) * (fx / (4 * m)) 
    = (fl * fx) / (36 * m)

따라서, 장발 및 AX3을 가진 여성의 수와 장발 및 AX3을 가진 남성의 수의 가능한 비율은 :

flx             :   mlx
(fl * fx) / f   :   (fl * fx) / (36 * m)
1/f             :   1 / (36m)
36m             :   f

동일한 수의 50:50이 제공되므로 양쪽을 취소하고 모든 수컷에게 36 명의 암컷으로 끝낼 수 있습니다. 그렇지 않으면, 지정된 부분 군의 모든 수컷에 대해 36 * m / f 암컷이 있습니다. 예를 들어, 남성보다 여성의 수가 두 배인 경우, 긴 머리와 AX3을 가진 남성의 여성은 각각 72 명입니다.


1
이 솔루션은 현재 문제에 명시된 것 이상을 가정합니다. 즉, 긴 머리, AX3 성별은 독립적입니다. 그렇지 않으면, 당신은 긴 머리를 가진 여성들에게 pfx를 적용하는 것을 정당화 할 수 없습니다.
whuber

@ whuber : 예, 그 가정을합니다. 그러나 보유한 데이터를 기반으로 최상의 근사치를 제공 할 확률의 목적이 아닙니까? 따라서 장모와 AX3이 일반 인구에 대해 독립적이라는 것을 이미 알고 있으므로 명시 적으로 배울 때까지 남성과 여성에게이 가정을 전달해야합니다. 물론 이것은 보편적으로 올바른 것이 아니지만 더 많은 정보를 얻을 때까지 만들 수있는 최선의 방법입니다. Q : 현재 데이터 만 있으면 커튼 뒤의 여성 일 확률을 %로 설정해야한다면 실제로 "0에서 100 % 사이"라고 말 하시겠습니까?
Briguy37

1
우리는 철학에 중요한 차이가 있습니다. @Briguy. 나는 근거없는 가정 을 하지 않는 것을 강하게 믿는다 . 상호 독립성 가정이 어떤 의미에서 "최고"인지는 확실하지 않습니다. 특정 적용 분야에있을 수 있음을 인정합니다. 그러나 일반적으로 그것은 위험합니다. 문제를 해결하는 데 필요한 가정에 대해 분명히 밝히기를 원하므로 사람들은 답을 얻기 위해 수학적으로 편리한 것을 가정하지 않고 가정을 확인하기 위해 데이터를 수집 할 가치가 있는지 여부를 결정할 수 있습니다. 통계와 수학의 차이점입니다.
whuber

귀하의 질문에 대답하기 위해 : 예, 0 %-100 %는 내가 줄 것입니다. (이 사이트에서 비슷한 질문에 비슷한 답변을했습니다.)이 범위는 불확실성을 정확하게 반영합니다. 이 문제는 Ellsberg 역설 과 밀접한 관련이 있습니다. Ellsberg의 원본 ​​논문은 잘 작성되어 있고 명확합니다. 추천합니다.
whuber

@ whuber : 나와 대화에 시간을 내 주셔서 감사합니다. 나는 가정을 통해 생각하고 나열하는 것의 중요성에 대한 당신의 요점을보고 그에 따라 나의 대답을 업데이트했습니다. 그러나 귀하의 답변과 관련하여 나는 그것이 불완전하다고 생각합니다. 그 이유는 알려지지 않은 모든 사례를 고려하고 모든 사례에서 최종 답변에 도달 할 평균 확률을 찾을 수 있기 때문입니다. EG 두 가지 모두 여전히 가능하지만, 모든 경우에 걸쳐 50 %를 초과하는 확률이 50 % 미만을 갖는 확률보다 훨씬 더 우세하므로, 우리는 그것이 여성임을 추측하는 것이 좋습니다.
Briguy37

-4

98 % 여성, 간단한 보간. 첫 번째 전제 90 % 여성, 10 % 출발, 두 번째 전제는 기존 10 %의 2 % 만 떠나므로 98 % 여성

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.