이것이 베이 즈 정리를 사용하여 확률을 지속적으로 업데이트하는 올바른 방법입니까?

누군가가 좋아하는 아이스크림 맛이 바닐라 일 확률을 찾으려고 노력한다고 가정 해 봅시다.

나는 그 사람도 공포 영화를 즐긴다는 것을 안다.

공포 영화를 즐기는 사람이 가장 좋아하는 아이스크림이 바닐라 일 가능성을 알고 싶습니다.

다음 사항을 알고 있습니다.

$5\%$ 사람들은 바닐라를 좋아하는 아이스크림 맛으로 선택합니다. ( 이것은 나의 $P(A)$ )
$10\%$ 바닐라 아이스크림을 좋아하는 사람들은 공포 영화를 좋아합니다. ( 이것은 나의 $P(B|A)$ )
$1\%$ 바닐라 아이스크림을 좋아하지 않는 사람들의 공포 영화도 좋아합니다. $P(B|\lnot A)$ )

따라서 다음과 같이 계산합니다.

피 (ㅏ | 비) = \frac{0.05 \times 0.1}{(0.05 \times 0.1) + (0.01 \times (1 - 0.05))}

$P(A|B)=\frac{0.05\times0.1}{(0.05 \times 0.1)+(0.01 \times(1-0.05))}$ 나는 그것을 발견

P (A | B) = 0.3448

$P(A|B) = 0.3448$ (가장 가까운 십만에 반올림). 이있다

34.48 %

$34.48\%$ 공포 영화 팬이 가장 좋아하는 아이스크림 맛은 바닐라입니다.

그러나 나는 지난 30 일 동안 그 사람이 공포 영화를 본 것을 알게되었습니다. 내가 아는 것은 다음과 같습니다.

$34.48\%$ 바닐라가 사람이 가장 좋아하는 아이스크림 맛일 가능성이 높은 사후 확률입니다. $P(A)$ 이 다음 문제에서.
$20\%$ 바닐라 아이스크림을 좋아하는 사람들 중 지난 30 일 동안 공포 영화를 본 적이 있습니다.
$5\%$ 바닐라 아이스크림이 아닌 사람들이 지난 30 일 동안 공포 영화를 보았습니다.

이것은 다음을 제공합니다.

\frac{0.3448 \times 0.2}{(0.3448 \times 0.2) + (0.05 \times (1 - 0.3448))} = 0.6779

$\frac{0.3448\times0.2}{(0.3448\times0.2)+(0.05\times(1-0.3448))} = 0.6779$ 반올림 될 때.

이제는 $67.79\%$ 지난 30 일 동안 공포 영화를 본 적이있어 공포 영화 팬이 아이스크림을 좋아할 가능성이 있습니다.

그러나 또 다른 것이 있습니다. 나는 또한 그 사람이 고양이를 소유하고 있다는 것을 배웠다.

내가 아는 것은 다음과 같습니다.

$67.79\%$ 바닐라가 사람이 가장 좋아하는 아이스크림 맛일 가능성이 높은 사후 확률입니다. $P(A)$ 이 다음 문제에서
$40\%$ 바닐라 아이스크림을 좋아하는 사람들의 고양이도
$10\%$ 바닐라 아이스크림이 아닌 사람들이 고양이를 좋아합니다.

이것은 다음을 제공합니다.

\frac{0.6779 \times 0.4}{(0.6779 \times 0.4) + (0.1 \times (1 - 0.6779))} = 0.8938

$\frac{0.6779\times0.4}{(0.6779\times 0.4)+(0.1\times(1-0.6779))} = 0.8938$ 반올림 될 때.

내 질문은 기본적으로 다음과 같이 요약됩니다. Bayes의 정리를 사용하여 확률을 올바르게 업데이트하고 있습니까? 내 방법에 다른 문제가 있습니까?

probability bayes

— 사용자 1626730
소스

사랑 = 좋아하는? 당신은 사랑의 정도를 게시하지 않습니다. 당신이 그것을 좋아한다면, 그것은 당신의 마음에 드는 것입니다. 필요한 경우 설명하십시오.

— generic_user

좋은 지적. "사랑"을 "즐겨 찾기"로 변경했습니다. 문법적으로 정확하지는 않지만 "좋아하는 아이스크림 맛을 위해 바닐라를 선택하십시오." 나는 그것이 일을 정리하기를 바랍니다.

— user1626730

이것은 정확 하지 않습니다 . 이 유형의 순차적 업데이트는 순차적으로받는 정보가 독립적 일 때만 작동합니다 (예 : 임의 변수의 iid 관찰). 이 경우와 같이 각 관측치가 독립적이지 않은 경우 결합 확률 분포를 고려해야합니다. 올바른 업데이트 방법은 이전으로 돌아가서 누군가가 공포 영화를 좋아하고 지난 30 일 동안 공포 영화를 보았으며 바닐라를 좋아하는 아이스크림 맛을 한 번에 업데이트 할 수 있습니다.

데이터가 독립적이지 않을 때 이와 같이 순차적으로 업데이트하면 사후 확률이 예상보다 훨씬 높거나 낮아집니다.

— 조나단 크리스텐슨
소스

"순차적으로 수신하는 정보가 독립적 일 때"란 무엇을 의미합니까? "예상하려는 이벤트와 독립적"을 의미하는 경우 내가 얻는 정보가 독립적인지 어떻게 알 수 있습니까?

— user1626730

예측하려는 이벤트가 주어지면 조건부 독립적입니다. 그들이 당신이 예측하려고하는 사건과 무관하다면 그들은 당신을 잘하지 않을 것입니다. 당신이 말할 수있는 방법에 관해서는 데이터가 무엇인지 생각해야합니다. 이 경우, 지난 30 일 동안 누군가가 공포 영화를 보았는지 여부는 공포 영화를 좋아하는지 여부와 무관합니다.

— Jonathan Christensen

당신이 "조건부 독립"이라고 말할 때, 나는 당신이 각각의 P (B) (즉, 공포 영화를 좋아하고, 고양이 소유권)가 서로 관련이 없다는 것을 의미한다고 생각합니다. 그렇다면 고양이 소유 변수가 공포 영화를 좋아하는 것이 아닌가?

— user1626730

그렇습니다. 고양이 소유가 공포 영화를 좋아한다는 주장을 할 수 있습니다. 그러나 아마도 여성이 고양이를 좋아할 가능성이 높고 공포 영화를 좋아할 가능성이 낮을 수도 있습니다.

— Jonathan Christensen

흠, 나는 여자와 고양이에 대해 그 비트를 추가하여 당신이 무엇을 의미하는지 잘 모르겠습니다. 더 설명해 주시겠습니까?

— user1626730