관련 Bernoulli 시험, 다변량 Bernoulli 분포?


15

직장에서 가지고있는 연구 질문을 단순화하고 있습니다. 내가 5 개의 동전을 가지고 있고 머리를 성공적으로 부르 자고 상상해보십시오. 이들은 성공 확률 p = 0.1 인 매우 편향된 동전입니다. 이제 동전이 독립적이라면 적어도 1 머리 이상 확률을 얻는 것은 매우 간단합니다. . 내 시나리오에서 Bernoulli 시험 (코인 토스)은 독립적이지 않습니다. 내가 액세스 할 수있는 유일한 정보는 성공 확률 (각각 p = 1입니다)과 이진 변수 간의 이론적 피어슨 상관 관계입니다.1(11/10)5

이 정보만으로 하나 이상의 성공 확률을 계산할 수있는 방법이 있습니까? 이러한 이론적 결과가 시뮬레이션 연구의 정확성을 안내하는 데 사용될 것이기 때문에 시뮬레이션 기반 접근법을 피하려고합니다. 나는 다변량 Bernoulli 분포를 조사했지만 상관 관계와 성공의 한계 확률로만 완전하게 지정할 수 있다고 생각하지 않습니다. 내 친구는 Bernoulli marginals (R package 사용 copula)를 사용하여 Gaussian copula를 구성 한 다음 pMvdc()큰 샘플 에서 함수 를 사용하여 원하는 확률을 얻을 것을 권장 했지만 정확히 어떻게 사용 해야하는지 잘 모르겠습니다.


다변량 베르누이 분포는 여기에 설명되어 있습니다 : arxiv.org/abs/1206.1874
Tim

시련 사이에 일시적인 요소가 있습니까, 아니면 모두 병렬입니까? 전자의 경우 가 에만 의존 하는 단순화 가정을 할 수 있습니다 . 여기서 은 Markov 모델의 순서를 나타냅니다. t r i a l i n ntrialitrialinn
바브

답변:


17

아니요, 세 개 이상의 동전이있을 때마다 불가능합니다.

두 개의 동전의 경우

두 개의 코인에 대해 왜 그것이 더 많은 코인의 경우에 무엇이 고장인지에 대한 직관을 제공하기 때문에 왜 그것이 작동하는지 봅시다.

하자 및 두 경우에, 대응하는 베르누이 분산 나타내는 변수 , . 먼저, 와 의 상관 관계 는Y X ~ B e r ( p ) Y ~ B e r ( q ) X YXYXBer(p)YBer(q)XY

corr(X,Y)=E[XY]E[X]E[Y]Var(X)Var(Y),

한계 값을 알고 있으므로 , , 및 을 알고 있으므로 상관 관계를 알고 있으면 . 이제 과 인 경우에만 이므로 E [ Y ] V a r ( X ) V a r ( Y ) E [ X Y ] X Y = 1 X = 1 Y = 1E[X]E[Y]Var(X)Var(Y)E[XY]XY=1X=1Y=1

E[XY]=P(X=1,Y=1).

한계 값을 알면 이고 . 방금 이라는 것을 알았으므로 및 도 알고 있지만 당신이 찾고있는 확률은p=P(X=1,Y=0)+P(X=1,Y=1)q=P(X=0,Y=1)+P(X=1,Y=1)P(X=1,Y=1)P(X=1,Y=0)P(X=0,Y=0)

P(X=1,Y=0)+P(X=0,Y=1)+P(X=1,Y=1).

이제 개인적으로이 모든 것을 그림으로 쉽게 볼 수 있습니다. 하자 . 그런 다음 다양한 확률을 사각형으로 표시 할 수 있습니다.Pij=P(X=i,Y=j)

여기에서 상관 관계를 알면 빨간색으로 표시된 추론 할 수 있고 한계를 알면 각 모서리의 합계 (하나는 파란색 사각형으로 표시됨)를 알 수 있습니다.P11

3 개의 동전의 경우

이것은 세 개의 동전만큼 쉽게 갈 수는 없습니다. 직관적으로 그 이유를 알기가 어렵지 않습니다. 한계와 상관 관계를 알면 총 모수를 알 수 있지만 합동 분포에는 결과가 있지만 그 중 에 대한 확률을 알면 마지막 것을 알아낼 수 있습니다. 이제 이므로 한계와 상관 관계가 동일한 두 개의 서로 다른 관절 분포를 만들 수 있고 찾고자하는 것이 다를 때까지 확률을 퍼뜨리는 것이 합리적입니다.6=3+323=877>6

하자 , , 및 세 가지 변수, 그리고하자XYZ

Pijk=P(X=i,Y=j,Z=k).

이 경우 위의 그림은 다음과 같습니다.

여기에 이미지 설명을 입력하십시오

치수가 하나씩 충돌했습니다. 빨간색 정점이 여러 개의 색상이있는 가장자리가되고 파란색 사각형으로 덮인 가장자리가 전체면이되었습니다. 여기서 파란색 평면은 한계 값을 알면 확률의 합을 알 수 있습니다. 사진 속 하나를 위해

P(X=0)=P000+P010+P001+P011,

입방체의 다른 모든면에 대해서도 비슷합니다. 색상이있는 모서리는 상관 관계를 알면 모서리로 연결된 두 확률의 합을 알 수 있습니다. 예를 들어, 을 알고 있으면 (정확하게 위와 같음) 를 알게 됩니다.E [ X Y ]corr(X,Y)E[XY]

E[XY]=P(X=1,Y=1)=P110+P111.

따라서 이것은 가능한 관절 분포에 약간의 제한을 두지 만, 이제 큐브의 꼭짓점에 숫자를 넣는 조합 연습으로 운동을 줄였습니다. 더 이상 고민하지 않고 한계와 상관이 동일한 두 개의 공동 분포를 제공하십시오.

여기에 이미지 설명을 입력하십시오

여기에서 확률 분포를 얻기 위해 모든 수를 으로 나눕니다 . 이러한 작업이 동일하고 한계 / 상관 관계가 동일한 지 확인하려면 각면의 확률의 합이 (변수가 )이고 합이 색상이있는 모서리의 정점은 두 경우 모두에 동의합니다 (이 경우에는 모든 상관 관계가 실제로 동일하지만 일반적인 경우는 아닙니다).1 / 2 B의 전자 R ( 1 / 2 )1001/2Ber(1/2)

마지막으로, 적어도 하나의 헤드 및 을 얻는 확률은 두 경우에서 다릅니다. 이것이 우리가 증명하고자하는 것입니다. 1 P ' 0001P0001P000

저에게이 예제를 생각해 낸 것은 큐브에 숫자를 두어 하나의 예제를 만든 다음 수정 하고 변경 사항을 전파하는 것입니다.P111

편집 : 이것은 실제로 고정 마진으로 작업하고 있으며 각 변수가 이라는 것을 알고 있지만 위의 그림이 의미가 있다면 조정할 수 있습니다. 원하는 여백이 생길 때까지Ber(1/10)

4 개 이상의 동전

마지막으로, 코인이 3 개 이상인 경우 조인트 분포를 설명하는 데 필요한 매개 변수의 수와 한계 및 상관 관계.

구체적으로, 3보다 큰 동전의 수에 대해, 위의 두 예에서와 같이 처음 세 개의 동전이 동작하고 최종 두 동전의 결과가 다른 모든 동전과 독립적 인 예를 간단히 고려할 수 있습니다.


3

관련된 Bernoulli 시험은 계산 된 결과에 대한 베타 이항 분포로 이어집니다. 지정된 분포 값을 제공하기 위해이 분포를 매개 변수화 한 다음 원하는 확률을 계산할 수 있어야합니다.


베타 이항은 성공 확률 매개 변수가 베타 다음의 임의 변수 인 이항이 아닌가? OP의 문제에 어떻게 적용됩니까?
AG

1
예, 그것은 분포의 한 특성입니다. 또한 관련 Bernoulli 시험의 솔루션 중 하나입니다 (예 : Hisakado et al 2006 참조 )
Ben-Reinstate Monica

그렇습니다! 공감.
AG

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.