감마 분포와 정규 분포의 관계


26

나는 최근에 평균이 0 인 정규 랜덤 변수의 제곱에 대한 pdf를 도출해야한다는 것을 알았습니다. 어떤 이유로 든, 나는 사전에 분산을 표준화하지 않기로 선택했습니다. 내가 이것을 올바르게했다면이 pdf는 다음과 같습니다.

N2(x;σ2)=1σ2πxex2σ2

나는 이것이 실제로 감마 분포의 매개 변수라는 것을 알았습니다.

N2(x;σ2)=Gamma(x;12,2σ2)

그런 다음 두 감마의 합계 (같은 스케일 매개 변수 사용)가 다른 감마와 같다는 사실에서 감마는 제곱 정규 랜덤 변수 의 합과 같습니다 .k

NΣ2(x;k,σ2)=Gamma(x;k2,2σ2)

이것은 나에게 조금 놀랐습니다. 나는 알고 있지만 제곱의 합의 분포 - 유통 표준 정상의 RV를 - 나는 감마는 본질적으로 정상의 합을 허용 단지 일반화 몰랐어요, 감마의 특별한 경우였다 모든 분산 의 임의 변수. 이것은 또한 지수 분포가 두 제곱 정규 분포의 합과 같은 이전에 보지 못했던 다른 특성으로 이어집니다.χ2

이것은 나에게 다소 신비합니다. 정규 분포는 위에서 설명한 방식으로 감마 분포의 유도에 기본입니까? 내가 확인한 대부분의 자료는 두 분포가 본질적으로 이와 관련이 있거나 심지어 그 문제에 대해 감마가 도출되는 방법을 설명한다는 언급은 없습니다. 이것은 저수준의 진실이 복잡한 방식으로 강조되었다고 생각 하는가?


6
확률 이론에 관한 많은 학부 교과서 는 위의 모든 결과를 언급합니다. 그러나 아마도 통계 텍스트가 이러한 아이디어를 다루지 않습니까? 어쨌든 랜덤 변수 는 여기서 는 표준 정규 랜덤 변수이므로 (iid 변수의 경우) 는 단순히 스케일 된 확률 변수는 확률 이론을 연구 한 사람들에게는 놀라운 일이 아닙니다. Y i σ X i X i i Y 2 i = σ 2 i X 2 i χ 2N(0,σ2)YiσXiXiiYi2=σ2iXi2 χ2
Dilip Sarwate

나는 컴퓨터 비전 배경을 가지고 있기 때문에 일반적으로 확률 이론에 직면하지 않습니다. 내 교과서 (또는 Wikipedia) 중 어느 것도이 해석에 대해 언급하지 않았습니다. 나는 또한 대기 시간 (즉, 지수 분포)에 대한 좋은 모델을 만드는 두 정규 분포의 제곱의 합에 대해 특별한 점을 묻고 있다고 가정합니다. 여전히 내가 더 깊은 것을 놓친 것 같은 느낌이 든다.
timxyz

3
위키 백과 en.wikipedia.org/wiki/Chi-squared_distribution#Definition 에서 카이 제곱 분포를 제곱 법선의 합으로 정의 하고 카이 제곱은 감마의 특수한 사례라고 언급합니다 ( en.wikipedia.org/wiki). / Gamma_distribution # Others ), 이러한 관계가 잘 알려져 있지 않다고 거의 주장 할 수 없습니다. 분산 자체는 모든 경우에 측정 단위 (스케일 매개 변수)를 설정하기 때문에 추가적인 합병증이 전혀 발생하지 않습니다.
whuber

3
이러한 결과는 확률 및 통계 분야에서 잘 알려져 있지만, 분석을 통해 결과를 다시 발견하기 위해 @timxyz를 잘 수행했습니다.
복원 Monica Monica

연결은 신비하지 않습니다. 그것들은 중요한 분포 속성의 변수이기 때문에 변수 및 / 또는 매개 변수를 대체하여 도달 할 수 있다는 것입니다. 예제와 함께 아래에 더 긴 답변을 참조하십시오.
Carl

답변:


18

Sarwate 교수의 의견에서 언급했듯이, 제곱 법선과 카이 제곱 사이의 관계는 매우 널리 퍼진 사실입니다. 카이 제곱은 감마 분포의 특별한 경우이기도하기 때문입니다.

XN(0,σ2)X2/σ2χ12X2σ2χ12=Gamma(12,2σ2)

감마의 스케일링 속성에 따른 마지막 동등성

지수와의 관계와 관련하여, 정확한 것은 두 개의 제곱 평균 법선의 합이 각각 다른 것의 분산에 의해 스케일링되어 지수 분포로 이어집니다.

X1N(0,σ12),X2N(0,σ22)X12σ12+X22σ22χ22σ22X12+σ12X22σ12σ22χ22

σ22X12+σ12X22σ12σ22χ22=Gamma(1,2σ12σ22)=Exp(12σ12σ22)

그러나 두 제곱 제로 평균 의 합에 "특별한 것"또는 "더 깊은 것"이 있다는 의혹은 " 대기 시간에 대한 좋은 모델로 만든다"는 근거가 없다. 우선, 지수 분포에 대한 특별한 점은 무엇인가? 그것은 "대기 시간"에 대한 좋은 모델? 물론 기억이 없지만 여기에 "더 깊은"것이 있거나 지수 분포 함수의 간단한 기능적 형태와 의 속성이 있습니까? 독특한 속성은 수학 전체에 흩어져 있으며, 대부분 "직관"또는 "구조"를 반영하지 않습니다.e

둘째, 변수의 제곱은 수준과 관계가 거의 없습니다. 다만 고려 에서 말하자면, :[ 2 ,f(x)=x[2,2]

여기에 이미지 설명을 입력하십시오

... 또는 카이-제곱 밀도에 대한 표준 정규 밀도를 그래프로 나타내십시오. 두 번째가 첫 번째 제곱 인 변수의 밀도이기 때문에 서로 밀접한 관련이 있더라도 완전히 다른 확률 론적 행동을 반영하고 나타냅니다. 법선은 확률 론적 행동을 모델링하기 위해 우리가 개발 한 수학적 시스템의 매우 중요한 기둥 일 수 있습니다.


마지막 단락의 질문에 특히 답변 해 주셔서 감사합니다.
timxyz

2
천만에요. 질문이 게시 된 지 26 개월 만에 답변이 원래 OP에 도달 한 것을 기쁘게 생각합니다.
Alecos Papadopoulos

11

제기 된 질문에 대해 이야기 해 봅시다. 이것은 모두 다소 신비합니다. 정규 분포가 감마 분포의 유도에 기본입니까? 미스터리가 아닙니다. 단순히 정규 분포와 감마 분포가 지수 분포 의 다른 분포 중에서 구성원이라는 것 입니다. 이 분포는 모수 및 / 또는 변수를 대체하여 방정식 형태를 변환하는 기능으로 정의됩니다. 결과적으로 분포 사이의 대체에 의한 많은 변환이 있으며 그 중 일부 는 아래 그림에 요약되어 있습니다.

여기에 이미지 설명을 입력하십시오레 미스, 로렌스 M .; Jacquelyn T. MCQUESTON (2008 년 2 월). "일 변량 분포 관계"(PDF). 미국 통계 학자. 62 (1) : 45-53. doi : 10.1198 / 000313008x270448 인용

여기에 두 가지 정규 및 감마 분포 관계가 자세히 설명되어 있습니다 (카이 제곱 및 베타를 통해 알 수없는 다른 수 중에서).

먼저 감마 분포 (GD)와 정규 분포 (ND) 사이에 평균 0이 더 직접적인 관계가 있습니다. 간단히 말해 GD는 모양 매개 변수가 증가함에 따라 모양이 정상이됩니다. 그것이 사실임을 증명하는 것이 더 어렵다. GD의 경우

GD(z;a,b)={baza1ezbΓ(a)z>00other.

GD 모양 매개 변수 이므로 GD 모양이 더 대칭적이고 정상적이지만 가 증가함에 따라 평균이 증가함에 따라 GD를 왼쪽으로 고정 상태로 유지하고 마지막으로 이동 된 GD에 대해 동일한 표준 편차를 유지하려면 비례 하여 척도 모수 ( )를 .aa(a1)1akb1a

즉, GD를 제한 사례 ND로 변환하기 위해 를 허용 하고 표준 편차를 왼쪽으로 이동하여 표준 편차를 상수 ( )로 설정했습니다. 를 대체하여 0의 모드그런 다음kb=1akz=(a1)1ak+x .

GD((a1)1ak+x; a, 1ak)={(ka)aeaxka+1((a1)ka+x)a1Γ(a)x>k(1a)a0other.

라는 한계 에서이 GD가 0이 아닌 인 의 가장 음의 값입니다 . 즉, 반 무한 GD 지원무한대로 됩니다. 다시 매개 변수가 지정된 GD의 로 제한을 취하면axa

lima(ka)aeaxka+1((a1)ka+x)a1Γ(a)=ex22k22πk=ND(x;0,k2)

및 대해 그래픽으로 GD는 파란색이고 한계 는 주황색, 아래k=2a=1,2,4,8,16,32,64ND(x;0, 22)

여기에 이미지 설명을 입력하십시오

둘째 ,이 분포들 사이의 형태의 유사성으로 인해 얇은 공기에서 그것들을 빼 냄으로써 감마와 정규 분포 사이의 관계를 거의 발전시킬 수 있다고 지적합시다. 다시 말해, 우리는 정규 분포의 "펼친"감마 분포 일반화를 개발합니다.

먼저 정규 분포와 더 직접적인 관계를 방해하는 것은 감마 분포의 반 무한 지원입니다. 그러나 반 정규 분포를 고려할 때 반 무시한지지를 갖는 장애를 제거 할 수 있습니다. 따라서, 하나의 제는 관련 하프 정상 (HND)로 접어 정규 분포 (ND)을 일반화 할 수있는 일반화 된 감마 분포 (GD)로, 다음에 대한 힘 드 우리 여행, 우리 "펴기"모두 (HND 및 따라서 일반화 된 ND (GND)를 만듭니다.

일반화 된 감마 분포

GD(x;α,β,γ,μ)={γe(xμβ)γ(xμβ)αγ1βΓ(α)x>μ0other,

반 정규 분포 로 다시 매개 변수화 할 수 있습니다 .

GD(x;12,πθ,2,0)={2θeθ2x2ππx>00other=HND(x;θ)

참고따라서θ=πσ2.

ND(x;0,σ2)=12HND(x;θ)+12HND(x;θ)=12GD(x;12,πθ,2,0)+12GD(x;12,πθ,2,0),

그 의미

GND(x;μ,α,β)=12GD(x;1β,α,β,μ)+12GD(x;1β,α,β,μ)=βe(|xμ|α)β2αΓ(1β),

는 정규 분포의 일반화입니다. 여기서 는 위치이고 은 스케일이며 은 모양이며 는 정규 분포를 나타냅니다. 경우 Laplace 배포가 포함됩니다 . 마찬가지로 , 밀도가 수렴에 균일 한 밀도로 점별 . 다음은 에 대해 일반 경우 는 주황색입니다.μα>0β>0β=2β=1β(μα,μ+α)α=π2,β=1/2,1,4α=π2,β=2

여기에 이미지 설명을 입력하십시오

위의 내용은 일반화 된 정규 분포 버전 1 로 볼 수 있으며 다른 매개 변수화는 지수 전력 분배 및 일반화 된 오차 분포로 알려져 있으며, 이는 여러 다른 일반화 된 정규 분포 중 하나입니다 .


2

정규 분포에서 카이 제곱 분포를 도출하는 것은 지수 분포에서 감마 분포를 도출하는 것과 매우 유사합니다.

우리는 이것을 일반화 할 수 있어야합니다 :

  • 가 전력 계수 을 갖는 일반 정규 분포 와 독립적 인 변수 인 경우 은 축척 된 카이 제곱 분포와 관련이있을 수 있습니다 ( "자유도"는 과 같습니다) ).XimY=inXimn/m

비유는 다음과 같습니다.

정규 분포와 카이 제곱 분포는 제곱의 합과 관련이 있습니다.

  • 여러 독립 표준 정규 분포 변수의 결합 밀도 분포는 fxi2
    f(x1,x2,...,xn)=exp(0.5i=1nxi2)(2π)n/2

  • 만약XiN(0,1)

    그런 다음i=1nXi2χ2(ν)

지수 및 감마 분포는 정규 합과 관련이 있습니다.

  • 여러 독립 지수 분포 변수의 결합 밀도 분포는 에 따라 다릅니다. xi

    f(x1,x2,...,xn)=exp(λi=1nxi)λn

  • 만약XiExp(λ)

    그런 다음i=1nXiGamma(n,λ)


모든 것이 아니라 요약 된 용어에 대해서만 통합 된 변수의 변경에 의해 도출 될 수 있습니다 (1900 년 Pearson이 수행 한 것임 ). 이것은 두 경우 모두 매우 유사합니다.x1,x2,...xn

를 들어 배급 :χ2

fχ2(n)(s)ds=es/2(2π)n/2dVdsds=es/2(2π)n/2πn/2Γ(n/2)sn/21ds=12n/2Γ(n/2)sn/21es/2ds

여기서 는 반지름이 제곱 인 n 볼의 n 차원 부피입니다. .V(s)=πn/2Γ(n/2+1)sn/2s

감마 분포의 경우 :

fG(n,λ)(s)ds=eλsλndVdsds=eλsλnnsn1n!ds=λnΓ(n)sn1eλsds

여기서 은 n- 폴리 토프의 n 차원 부피입니다 .xi<sV(s)=snn!xi<s


감마 분포는 푸 아송 프로세스에서 번째 이벤트에 대한 대기 시간 로 볼 수 있으며, 이는 지수 적으로 분산 된 변수 의 합으로 분포됩니다 .N NYnn

Alecos Papadopoulos가 이미 언급했듯이, 제곱 정규 변수의 합을 '대기 시간에 대한 좋은 모델'로 만드는 더 깊은 연결은 없습니다. 감마 분포는 일반화 된 정규 분포 변수의 합계에 대한 분포입니다. 이것이 두 사람이 함께하는 방식입니다.

그러나 합계 유형과 변수 유형이 다를 수 있습니다. 지수 분포 (p = 1)에서 파생 된 감마 분포는 지수 분포 (대기 시간)의 해석을 가져 오는 동안, 제곱 가우스 변수의 합계로 돌아가서 동일한 해석을 사용할 수는 없습니다.

대기 시간에 대한 밀도 분포는 기하 급수적으로 떨어지고 가우시안 오차에 대한 밀도 분포는 기하 급수적으로 떨어진다 (사각형). 이것이 두 사람이 연결된 것을 보는 또 다른 방법입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.