동일하거나 다른가요? 베이지안 방식


10

다음 모델이 있다고 가정 해보십시오.

푸 아송(λ){λ1만약 <τλ2만약 τ

그리고 내 데이터에서 아래에 표시된 및 의 후부를 추론합니다 . 과 \ lambda_2같거나 다른지 를 알려주는 베이지안 방법이 있습니까?λ 2 λ 1 λ 2λ1λ2λ1λ2

아마도 \ lambda_1\ lambda_2 와 다를 가능성을λ1λ2 측정 합니까? 아니면 KL 분기를 사용합니까?

예를 들어 (λ2λ1) 또는 적어도 p (\ lambda_2 \ gt \ lambda_1)을 측정하는 방법은 (λ2>λ1)무엇입니까?

일반적으로 아래에 표시된 후부가 있으면 ( 두 곳에서 모두 0이 아닌 PDF 값으로 가정 )이 질문에 대답하는 좋은 방법은 무엇입니까?

여기에 이미지 설명을 입력하십시오

최신 정보

이 질문은 두 가지 방법으로 대답 할 수 있습니다.

  1. 사후의 표본이 있다면 λ1λ2 (또는 λ2>λ1 ) 인 표본의 일부를 볼 수 있습니다. @ Cam.Davidson.Pilon에는 이러한 샘플을 사용하여이 문제를 해결하는 답변이 포함되었습니다.

  2. 후부의 차이를 통합합니다. 그리고 그것은 내 질문의 중요한 부분입니다. 그 통합은 어떻게 생겼습니까? 아마도 샘플링 접근법은이 적분에 근사하지만이 적분의 공식을 알고 싶습니다.

참고 : 위의 도표는 이 자료 에서 나온 입니다.


두 분포의 분산을 계산하고 추가 할 수 있습니다. 이것이 평균의 차이의 분산입니다. 그런 다음 평균의 차이를 계산하고 표준 편차의 수를 확인하십시오. 정규 분포를 사용하여 두 분포를 근사화하여 정규 분포에 대해 일반적인 신뢰 구간을 사용하고 시작할 수 있습니다. 그들은 분명히 다른 수단입니다.
Dave31415


3
필요한 모든 계산에서 제공하는 내 논문 하지만 난의 경우 공부하지 않은 ( 두 포아송 비율의 비율이다)ϕH0:{ϕ=1}ϕ
스테판 로랑

@ StéphaneLaurent에게 감사합니다. 귀하의 논문은 훌륭한 포인터이지만 포아송 프로세스에만 적용되는 것으로 보입니다. 가 과 같거나 다른지 여부를 추정하기 위해 베이지 할 수있는 비교는 무엇입니까 ? 분석은 분포에 따라 달라야합니까? λ 1λ2λ1
Amelio Vazquez-Reina

2
죄송합니다 @ user023472 요즘 에너지가 없습니다. 내 논문에 인용 된 Bernardo의 논문을 참조하십시오. "내재적"은 방법이 모델에서 파생되고 모델에서만 파생됨을 의미합니다.
Stéphane Laurent

답변:


7

더 좋은 질문은 크게 다르다는 것입니다.

이에 대한 답을 얻으려면 을 계산해야합니다 . 이 수량 호출하십시오 . 경우 , 다음 동등한 기회의 하나가 다른 것보다 더 큰있다. 반면에 가 실제로 1에 yes 보다 큽니다 (읽기 : 다릅니다) .(λ2>λ1)0.50λ2λ1

는 어떻게 계산 합니까? 베이지안 MCMC 프레임 워크에서는 간단합니다. 우리는 후부의 샘플을 가지고 있으므로 샘플 이 보다 큰 차이를 .λ2λ1

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

나는 이것을 책에 포함시키지 않은 것에 대해 사과한다. 나는 그것이 베이지안 추론에서 가장 유용한 아이디어 중 하나라고 생각하기 때문에 그것을 분명히 추가 할 것이다.


5
확률은 1.0이며, 둘 다 연속 랜덤 변수이므로 다릅니다. 다음을 고려하십시오 : ? 당신은 정말로 그들이 실제로 같다고 생각합니까? (가설 검정은 무시하십시오 : 우리는 변수가 실제로 동일하지 않은 실제 세계에 살고 있습니다). 내 영웅 인 Gelman 의이 게시물 을 참조하십시오 . 계산적으로 계산하여이를 테스트 할 수 있습니다 . λ1=λ2np.mean( lambda_2_samples != lambda_1_samples)
Cam.Davidson.Pilon

1
(|λ1λ2|>1)(λ1λ2)

3
λ1λ2λ2λ1

1
오 이런, 나는 그 상황에있는 것을 싫어한다! 그것은 불완전한 적분을 포함합니다. 대부분의 모델의 경우 실제로 후부를 파생시킬 수 없습니다. 가능한 경우에도 샘플을 얻기 위해 컴퓨터를 사용하는 것이 좋습니다. 요약하면, 샘플> 이와 같은 계산 공식 .
Cam.Davidson.Pilon

2
"충분히 더 큰"측정하지 않습니다. 피크가 0이고 피크가 -10, 10 인 질량이 같은 분포를 고려하십시오. 통계 (한 표본이 다른 것보다 더 큰 지표의 예상 값)는 0.5이지만 분포는 완전히 다릅니다.
Neil G

5

λ1λ2홍보(λ1=λ2)=0

λ1λ2ϵ[ϵ/2,ϵ/2]

λ2>λ1


감사. 귀하의 답변은 OP의 의견에서 논의 된 일부 아이디어와 어떤 관련이 있습니까?
Amelio Vazquez-Reina

사과하지만 이러한 방법 중 하나에 익숙하지 않으므로 의미있게 주석을 달 수 없습니다. @ Stéphane_Laurent는 꽤 똑똑하기 때문에 최소한 링크를 살펴 보는 것이 좋습니다.
Sycorax는

1
@ user023472 죄송합니다. 오늘 본질적 불일치 방식에 대한 답변을 구할 에너지가 없습니다. Kullback-Leibler 발산을 기반으로합니다.
Stéphane Laurent

ϵ(λ2>λ1)(λ2λ1)

감사합니다 @ user777. 샘플에 액세스 할 수없는 경우에 관심이 있습니다. 이전에 게시물에 필수 요소가 있었지만 삭제 한 것 같습니다. 그 통합은 어떤 모습일까요?
Amelio Vazquez-Reina
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.