이것이 베이 즈 정리를 사용하여 확률을 지속적으로 업데이트하는 올바른 방법입니까?


9

누군가가 좋아하는 아이스크림 맛이 바닐라 일 확률을 찾으려고 노력한다고 가정 해 봅시다.

나는 그 사람도 공포 영화를 즐긴다는 것을 안다.

공포 영화를 즐기는 사람이 가장 좋아하는 아이스크림이 바닐라 일 가능성을 알고 싶습니다.

다음 사항을 알고 있습니다.

  1. 5%사람들은 바닐라를 좋아하는 아이스크림 맛으로 선택합니다. ( 이것은 나의() )
  2. 10%바닐라 아이스크림을 좋아하는 사람들은 공포 영화를 좋아합니다. ( 이것은 나의(|) )
  3. 1% 바닐라 아이스크림을 좋아하지 않는 사람들의 공포 영화도 좋아합니다. (|¬) )

따라서 다음과 같이 계산합니다.

(|)=0.05×0.1(0.05×0.1)+(0.01×(10.05))
나는 그것을 발견 (|)=0.3448(가장 가까운 십만에 반올림). 이있다34.48% 공포 영화 팬이 가장 좋아하는 아이스크림 맛은 바닐라입니다.

그러나 나는 지난 30 일 동안 그 사람이 공포 영화를 본 것을 알게되었습니다. 내가 아는 것은 다음과 같습니다.

  1. 34.48% 바닐라가 사람이 가장 좋아하는 아이스크림 맛일 가능성이 높은 사후 확률입니다. () 이 다음 문제에서.
  2. 20% 바닐라 아이스크림을 좋아하는 사람들 중 지난 30 일 동안 공포 영화를 본 적이 있습니다.
  3. 5% 바닐라 아이스크림이 아닌 사람들이 지난 30 일 동안 공포 영화를 보았습니다.

이것은 다음을 제공합니다.

0.3448×0.2(0.3448×0.2)+(0.05×(10.3448))=0.6779
반올림 될 때.

이제는 67.79% 지난 30 일 동안 공포 영화를 본 적이있어 공포 영화 팬이 아이스크림을 좋아할 가능성이 있습니다.

그러나 또 다른 것이 있습니다. 나는 또한 그 사람이 고양이를 소유하고 있다는 것을 배웠다.

내가 아는 것은 다음과 같습니다.

  1. 67.79% 바닐라가 사람이 가장 좋아하는 아이스크림 맛일 가능성이 높은 사후 확률입니다. () 이 다음 문제에서
  2. 40% 바닐라 아이스크림을 좋아하는 사람들의 고양이도
  3. 10% 바닐라 아이스크림이 아닌 사람들이 고양이를 좋아합니다.

이것은 다음을 제공합니다.

0.6779×0.4(0.6779×0.4)+(0.1×(10.6779))=0.8938
반올림 될 때.

내 질문은 기본적으로 다음과 같이 요약됩니다. Bayes의 정리를 사용하여 확률을 올바르게 업데이트하고 있습니까? 내 방법에 다른 문제가 있습니까?


1
사랑 = 좋아하는? 당신은 사랑의 정도를 게시하지 않습니다. 당신이 그것을 좋아한다면, 그것은 당신의 마음에 드는 것입니다. 필요한 경우 설명하십시오.
generic_user

좋은 지적. "사랑"을 "즐겨 찾기"로 변경했습니다. 문법적으로 정확하지는 않지만 "좋아하는 아이스크림 맛을 위해 바닐라를 선택하십시오." 나는 그것이 일을 정리하기를 바랍니다.
user1626730

답변:


7

이것은 정확 하지 않습니다 . 이 유형의 순차적 업데이트는 순차적으로받는 정보가 독립적 일 때만 작동합니다 (예 : 임의 변수의 iid 관찰). 이 경우와 같이 각 관측치가 독립적이지 않은 경우 결합 확률 분포를 고려해야합니다. 올바른 업데이트 방법은 이전으로 돌아가서 누군가가 공포 영화를 좋아하고 지난 30 일 동안 공포 영화를 보았으며 바닐라를 좋아하는 아이스크림 맛을 한 번에 업데이트 할 수 있습니다.

데이터가 독립적이지 않을 때 이와 같이 순차적으로 업데이트하면 사후 확률이 예상보다 훨씬 높거나 낮아집니다.


1
"순차적으로 수신하는 정보가 독립적 일 때"란 무엇을 의미합니까? "예상하려는 이벤트와 독립적"을 의미하는 경우 내가 얻는 정보가 독립적인지 어떻게 알 수 있습니까?
user1626730

예측하려는 이벤트가 주어지면 조건부 독립적입니다. 그들이 당신이 예측하려고하는 사건과 무관하다면 그들은 당신을 잘하지 않을 것입니다. 당신이 말할 수있는 방법에 관해서는 데이터가 무엇인지 생각해야합니다. 이 경우, 지난 30 일 동안 누군가가 공포 영화를 보았는지 여부는 공포 영화를 좋아하는지 여부와 무관합니다.
Jonathan Christensen

당신이 "조건부 독립"이라고 말할 때, 나는 당신이 각각의 P (B) (즉, 공포 영화를 좋아하고, 고양이 소유권)가 서로 관련이 없다는 것을 의미한다고 생각합니다. 그렇다면 고양이 소유 변수가 공포 영화를 좋아하는 것이 아닌가?
user1626730

그렇습니다. 고양이 소유가 공포 영화를 좋아한다는 주장을 할 수 있습니다. 그러나 아마도 여성이 고양이를 좋아할 가능성이 높고 공포 영화를 좋아할 가능성이 낮을 수도 있습니다.
Jonathan Christensen

흠, 나는 여자와 고양이에 대해 그 비트를 추가하여 당신이 무엇을 의미하는지 잘 모르겠습니다. 더 설명해 주시겠습니까?
user1626730
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.