이변 량 이항 분포 시각화


11

질문 : 이변 량 이항 분포는 3 차원 공간에서 어떤 모양입니까?

다음은 다양한 매개 변수 값을 시각화하려는 특정 기능입니다. 즉, , 12 입니다.

에프(엑스1,엑스2)=!엑스1!엑스2!1엑스12엑스2,엑스1+엑스2=,1+2=1.

두 가지 제약 조건이 있습니다. 엑스1+엑스2=1+2=1 입니다. 또한, 은 양의 정수, 예를 들어 5 이다.

LaTeX (TikZ / PGFPLOTS)를 사용하여 함수를 플로팅하려고 두 번 시도했습니다. 그렇게하면 다음 값에 대해 아래 그래프를 얻습니다 , p 1 = 0.1p 2 = 0.9 , n = 5 , p 1 = 0.4p 2 = 0.6 . 도메인 값에 대한 제약 조건을 성공적으로 구현하지 못했습니다. x 1 + x 2 = n 이므로 약간 혼란스러워합니다.=51=0.12=0.9=51=0.42=0.6엑스1+엑스2=

모든 언어로 작성된 시각화는 잘 수행되지만 (R, MATLAB 등) TikZ / PGFPLOTS를 사용하여 LaTeX에서 작업하고 있습니다.

첫번째 시도

, p 1 = 0.1 p 2 = 0.9=51=0.12=0.9

여기에 이미지 설명을 입력하십시오

두 번째 시도

, p 1 = 0.4 p 2 = 0.6=51=0.42=0.6

여기에 이미지 설명을 입력하십시오

편집하다:

참고로 여기 에 일부 그래프가 포함 된 기사가 있습니다. 논문 제목은 Atanu Biswasa와 Jing-Shiang Hwang의 "새로운 이변 량 이항 분포"입니다. 통계 및 확률 서신 60 (2002) 231–240.

편집 2 : 명확성을 위해 그리고 의견에서 @GlenB에 대한 응답으로 아래는 내 책에서 배포판이 어떻게 나에게 제공되었는지에 대한 스냅 샷입니다. 이 책은 퇴화 / 비 퇴화 사례 등을 언급하지 않습니다. 그것은 단순히 그것을 그렇게 제시하고 그것을 시각화하려고했습니다. 건배! 또한 @JohnK가 지적했듯이 x1 + x1 = 1과 관련하여 오타가있을 가능성이 높으며 x1 + x1 = n이어야한다고 제안합니다.

여기에 이미지 설명을 입력하십시오

방정식 이미지 :

Spanos, A (1986) 계량 경제학 모델링의 기초. 케임브리지 대학 출판부


5
그러나 연속적이어서는 안됩니까? 두 랜덤 변수는 이산 적입니다.
JohnK

1
x1과 x2는 독립적입니다. 맞습니까? 의사 3D 플롯이 필요하십니까? 히트 맵이 허용됩니까?
gung-복원 Monica Monica


2
@JohnK 이고 p 1 + p 2 = 1 이면 X 1이항 ( n , p 1 )을 처리합니다 ( X 2 는 단순히 n - X 1입니다 ). 이다 변량 (변량, 그것의로 간주하거나, 이항 퇴화 ). 엑스1+엑스2=1+2=1엑스1이항식(,1)엑스2엑스1
Glen_b-복지 주 모니카

3
귀하의 질문에 이변 량 이항에 대한 사양이 없습니다. (이성형이라고도 할 수있는 이변 량 분포를 지정하는 방법은 여러 가지가 있습니다. 이변 형은 그 중 하나가 아니지만 일부는 특별한 경우가 있습니다). Biswasa & Hwang 참조는 불연속 이변 량 pmf의 적절한 표시 가 아닙니다 . 즉, 귀하의 질문에 아무 부족 하기 무승부를, 그리고 참고로 주로 방지하는 내용의 예로서 유용하다.
Glen_b-복지 주 모니카

답변:


8

여기에는 두 가지 부분이 있습니다. 먼저 개별 확률이 무엇인지 파악한 다음 어떻게 든 구성해야합니다.

이항 PMF는 수많은 '성공'에 대한 일련의 확률입니다. 이변 량 이항 PMF는 '성공'의 가능한 조합 조합에 대한 일련의 확률이 될 것입니다. 귀하의 경우, 이므로 ( 0 성공 가능성 을 염두에두고 ) 그리드 / 이변 량 이항 분포에 6 × 6 = 36 가능한 결과가 있습니다. 나는=제이=506×6=36

한계 이항 PMF를 먼저 계산할 수 있는데, 이는 매우 간단하기 때문입니다. 변수가 독립적이므로 각 공동 확률은 한계 확률의 곱일뿐입니다. 이것은 행렬 대수입니다. 다음은 R코드를 사용하여이 프로세스를 보여줍니다 .

b1 = dbinom(0:5, size=5, prob=0.1);  sum(b1)  # [1] 1
b9 = dbinom(0:5, size=5, prob=0.9);  sum(b9)  # [1] 1
b4 = dbinom(0:5, size=5, prob=0.4);  sum(b4)  # [1] 1
b6 = dbinom(0:5, size=5, prob=0.6);  sum(b6)  # [1] 1

b19 = b1%o%b9;  sum(b19)  # [1] 1
rownames(b19) <- colnames(b19) <- as.character(0:5)
round(b19, 6)
#       0        1        2        3        4        5
# 0 6e-06 0.000266 0.004783 0.043047 0.193710 0.348678
# 1 3e-06 0.000148 0.002657 0.023915 0.107617 0.193710
# 2 1e-06 0.000033 0.000590 0.005314 0.023915 0.043047
# 3 0e+00 0.000004 0.000066 0.000590 0.002657 0.004783
# 4 0e+00 0.000000 0.000004 0.000033 0.000148 0.000266
# 5 0e+00 0.000000 0.000000 0.000001 0.000003 0.000006
b46 = b4%o%b6;  sum(b46)  # [1] 1
rownames(b46) <- colnames(b46) <- as.character(0:5)
round(b46, 3)
#       0     1     2     3     4     5
# 0 0.001 0.006 0.018 0.027 0.020 0.006
# 1 0.003 0.020 0.060 0.090 0.067 0.020
# 2 0.004 0.027 0.080 0.119 0.090 0.027
# 3 0.002 0.018 0.053 0.080 0.060 0.018
# 4 0.001 0.006 0.018 0.027 0.020 0.006
# 5 0.000 0.001 0.002 0.004 0.003 0.001

이 시점에서 두 가지 필수 확률 행렬이 있습니다. 우리는 그것들을 그리는 방법을 결정하기 만하면됩니다. 솔직히 말해서, 나는 3D 막대 차트를 좋아하지 않습니다. 때문에 R나와 함께 동의하는 것 같다, 나는 Excel에서 이러한 플롯을했다 :

b19:

여기에 이미지 설명을 입력하십시오

b46:

여기에 이미지 설명을 입력하십시오


프리젠 테이션과 R 코드에 감사드립니다. 이것은 x1 + x2 = n에 대해 묻습니다. 이 상태가 유지되면 여기에 제시된 바와 같이,이 단지 기둥의 한 줄이어야합니다 : reference.wolfram.com/language/ref/MultinomialDistribution.html 나는 가정하자의 텅스텐 그래프 @Glen_b이 타락한 사례로 언급했다 무엇인가? 이것이 당신이 퇴행하지 않은 사례를 제시했음을 의미합니까?
Graeme Walsh

1
GraemeWalsh, 내 프레젠테이션에는 x1 + x2 = n 인 이변 량 이항식이 표시되지 않습니다. @Glen_b가 의견과 그의 답변에서 광범위하게 논의했듯이, 나는 그것을 자격이없는 "이변 량 이항 분포"라고 부르지 않을 것입니다. 또한 응답 의견에서 말했듯이 x1 & x2는 독립적이 아니라 완벽하게 의존적임을 의미합니다. 사실, 나는 이것이 기괴한 변형이라는 것을 알지 못했습니다 (충분히 읽지 않으면 나를 비난 할 수 있습니다). Glen_b가 보여 주듯이, 그 버전은 한 줄의 기둥입니다. 내가 제시 한 것은 비 퇴화 사건이었습니다.
gung-Monica Monica 복원

@ gung 나는 당신의 새로운 음모를 좋아합니다. 나는 당신의 논의가 퇴보 사건을 잘 다루고 있다고 생각한다 ( "개별 확률이 무엇인지 알아 내야한다"는 것이 실제로 모든 것을 말해야한다. 나는 그 사소한 계산을 수행했습니다.
Glen_b-복지 주 모니카

7

gung의 답변은 실제 이변 량 이항에 대한 좋은 답변이며 문제를 잘 설명합니다 (제목 질문에 대한 좋은 답변으로 수락하는 것이 좋습니다. 대부분의 사람들에게는 유용 할 것입니다).

엑스1

그래서 물건을 올바르게 정의합시다. 랜덤 변수에 대한 정의는 실제로 제공되지 않으므로 약간의 추측이 남아 있습니다.

와이1이항식(,1),(와이1=와이1)와이1와이1=0,1,...,엑스1=와이1/엑스1=0,16,26,...,1

(엑스1=엑스1)엑스2=엑스12=11

=6,1=0.3

여기에 이미지 설명을 입력하십시오

엑스2엑스11엑스1엑스2

우리는 이것을 (규모) 변성 이변 량 이항으로 간주 할 수 있습니다.

여기에 이미지 설명을 입력하십시오

그러나 책에서 정의 된 것을 이변 량 이항이라고 부르는 것은 약간의 스트레칭입니다 (효과적으로 단 변량 이항이기 때문에).

누군가가 3D 코드와 유사한 플롯을 생성하려고한다고 가정 할 때,이 작은 (R) 코드는 위의 두 번째 플롯에 매우 가깝습니다.

y = 0:6
x1 = y/6
x2 = 1-x1
p = dbinom(y,6,.3)
scatterplot3d(x1,x2,p,grid=TRUE, box=FALSE, cex.lab=1.2,
        color=3, cex.main=1.4,pch=21,bg=1,, type="h",angle=120,
        main="degenerate scaled binomial", ylab="x2", xlab="x1", 
        zlab="prob")

( scatterplot3d같은 이름의 기능을 포함 하는 패키지가 필요합니다 .)

"진정한"(변성되지 않은) 이변 량 이항식은 한 번에 두 변수에 변동이 있습니다. 다음은 특정 종류의 이변 량 이항식의 예입니다 (이 경우 독립적이지 않음). 나는 그렇지 않으면 "스틱"의 숲에서 길을 잃기 너무 쉽기 때문에 줄거리에서 다른 색상을 사용했습니다.

여기에 이미지 설명을 입력하십시오

엑스큰 상자(0,)와이큰 상자(와이,)큰 상자(,)엑스1=엑스+와이엑스2=엑스+

엑스1엑스2

0와이=엑스엑스1=엑스2엑스1+엑스2=

[1] : Hamdan, MA (1972),
"불균등 한 한계 지수를 갖는 이변 량 이항 분포의 정식 확장"
국제 통계 검토 , 40 : 3 (12 월), pp. 277-280


영형아르 자형아르 자형(엑스1,엑스2)=1

글렌 _b. 대단히 감사합니다. 내가 제시 한 수학 객체 (나에게 제시된 것!)가 (규모) 변성 이변 량 이항 항 이라는 점을 지적하면 매우 도움이되었습니다! 나는 처음부터 이것을 몰랐다. 마지막으로 초등학교 요청! 참 또는 실제 이변 량 이항을 정의하는 방법에 대해 (수학 표기법으로) 명시 적으로 표현할 수 있습니까? 도움이 될 것 같습니다.
Graeme Walsh

1
엑스큰 상자(0,)와이큰 상자(와이,)큰 상자(,)엑스1=엑스+와이엑스2=엑스+

1
엑스1엑스2

@Graeme ... 더 자세한 내용을 추가 할 계획입니다.
Glen_b-복지 주 모니카

4

Mathematica이제는 이런 것들이 상당히 강력 해졌습니다 . 문서에 문제의 해결책이 있습니다 . 약간의 추가로 나는 p = p1 = 0.4더 나은 시각적 표현 을 위해 모델을 만들었습니다 . 이것이 인터페이스의 모양과 제어 방법입니다.

여기에 이미지 설명을 입력하십시오

단편

Manipulate[
 Grid[{
   {DiscretePlot3D[
     PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right],

    DiscretePlot3D[
     CDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right]}
   }]
 ,
 {{n, 5}, 1, 20, 1, Appearance -> "Labeled"},
 {{p, 0.4}, 0.1, 0.9},
 TrackedSymbols -> True
 ]

여기서 가장 중요한 것은 PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}]자명 한 것입니다. Multinomial단지 pi각 변수에 대해 많은 분포를 가질 수 있음을 의미 합니다. 간단한 형태는 BinomialDistribution입니다. 물론 수동으로 만들 수도 있지만 내장 함수가 있으면 규칙을 사용해야합니다.

코드 구조에 대한 의견이 필요하면 알려주십시오.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.