베타 배포는 언제입니까?


13

여기에있는 모든 사람들이 이미 알고 있듯이 베타 배포판 의 PDF는 다음과 같이 제공됩니다.XB(a,b)

f(x)=1B(a,b)xa1(1x)b1

나는이 공식의 기원에 대한 설명을 위해 온통 사냥을 해왔지만 찾을 수는 없습니다. 베타 배포판에서 찾은 모든 기사는이 수식을 제공하고 몇 가지 모양을 보여준 다음 순간에 대해 논의하는 것으로 계속 진행됩니다.

나는 파생하고 설명 할 수없는 수학 공식을 사용하는 것을 좋아하지 않습니다. 다른 분포 (예 : 감마 또는 이항)의 경우 배우고 사용할 수있는 명확한 파생이 있습니다. 그러나 베타 배포판과 같은 것을 찾을 수 없습니다.

그래서 내 질문은 :이 공식의 기원은 무엇입니까? 처음 개발 된 상황에서 첫 번째 원칙에서 어떻게 도출 될 수 있습니까?

[명확하게하기 위해, 베이지안 통계에서 베타 분포를 사용하는 방법 또는 실제로 직관적으로 의미하는 것이 무엇인지 묻지 않습니다 (야구 예를 읽었습니다). PDF를 파생시키는 방법을 알고 싶습니다. 비슷한 질문 을 한 이전의 질문 이 있었지만 , 문제를 해결하지 못한 다른 질문 과 중복 된 것으로 표시되었습니다 (오답이라고 생각합니다) . 지금까지 어떤 도움도 찾을 수 없었습니다.]

2017-05-06 편집 : 질문에 대해 모두 감사합니다. 본인이 원하는 것에 대한 좋은 설명은 코스 강사 중 일부에게 물었을 때 얻은 답변 중 하나에서 비롯된 것 같습니다.

"나는 사람들이 sqrt (n)으로 나눈 n의 합의 한계로 정규 밀도를 도출 할 수 있다고 생각하며, 일정한 비율로 발생하는 사건에 대한 아이디어에서 포아송 밀도를 도출 할 수있다. 베타 밀도, 밀도에 관계없이 논리적으로 베타 배포 전에 무언가를 베타 배포로 만드는 것에 대한 일종의 아이디어가 있어야합니다. "

따라서 의견의 "ab initio"아이디어는 아마도 내가 찾고있는 것에 가장 가깝습니다. 나는 수학자가 아니지만, 내가 이끌어 낼 수있는 수학을 사용하는 것이 가장 편안하다고 생각합니다. 원점이 처리하기에 너무 진보 된 경우도 마찬가지이지만, 그렇지 않은 경우에는 이해하고 싶습니다.


5
무엇에서 파생 되었습니까? 이항-공액-우선 접근법이 수용 가능하지 않은 경우, 몇 가지 대안이 있습니다 (예 : 균일 한 랜덤 변수의 순서 통계, 감마 변수의 비율).
GeoMatt22

3
참고 : 베타 배포판의 전체 역사는 이 배포판 의 믿을 수없는 Wikipedia 페이지 에서 제공되며 여기에는 가능한 모든 세부 정보가 포함되어 있습니다!
시안

1
이전 질문 의 중복으로 표시하고 다른 영업 그들은 코멘트에서 후 무엇인지 명확히 후. whuber는 @ Geomatt22가 여기에서하는 것과 같은 질문을했습니다 : " 파생 이란 어떤 것이 확립 될 것으로 가정되는 것에서 논리적으로 연결되는 것을 의미합니다. 무엇을 가정하고 싶 습니까?"
Scortchi-Monica Monica 복원

2
@ Aksakal 그러나 질문은 너무 광범위합니다-그것은 모든 방식으로 도출 될 수 있습니다; 당신이 옳다면, 질문이 가능한 답을 얻을 수있는 것 이외의 것이 될 정도로 좁아 질 때까지 너무 광범위하게 닫을 것입니다.
Glen_b -Reinstate Monica

3
약간의 역사적 맥락에 대한 간단한 논의가 있습니다 (적어도 불완전한 베타 기능과의 관계 측면에서). 그것은 감마 분포와 관련이 있으며, 수많은 다른 분포가 있으며, 여러 가지 다른 방식으로 상당히 합리적으로 발생합니다. Xi'an이 지적했듯이 Pearson 시스템 에도 역사적인 기원이 있습니다 . 여기서 어떤 답변을 찾고 있습니까? 무엇을 주어야합니까?
Glen_b-복귀 모니카

답변:


6

전 물리학 자로서 나는 그것이 어떻게 도출 될 수 있었는지 볼 수있다. 물리학자가 진행하는 방법은 다음과 같습니다.

베타 함수 와 같은 양의 함수의 유한 적분을 만난 경우 : 가 무심코 밀도 정의 F ( S | X , Y ) = S (X) - 1 ( 1 - ) Y - 1

B(x,y)=01tx1(1t)y1dt
여기서0<s<1
f(s|x,y)=sx1(1s)y101tx1(1t)y1dt=sx1(1s)y1B(x,y),
0<s<1

그들은 항상 모든 종류의 적분에 이것을 행하기 때문에 생각조차하지 않고 반사적으로 발생합니다. 이 절차를 "정규화"또는 유사한 이름이라고합니다. 정의에 따라 밀도가 항상 양수와 합산하는 등 원하는 모든 속성을 갖는 방법 주목하십시오 .

위에서 제공 한 밀도 는 베타 분포입니다.f(t)

최신 정보

@whuber는 위의 논리가 무한한 수의 적분에 적용될 수있는 동안 베타 배포에 대해 특별한 점을 묻습니다 (위의 답변에서 언급했듯이)?

특별한 부분은 이항 분포 에서 비롯됩니다 . 매개 변수 및 변수에 대한 일반적인 표기법이 아닌 베타와 비슷한 표기법을 사용하여 PDF를 작성 합니다.

f(x,y|s)=(y+xx)sx(1s)y

여기서 성공 및 실패 수, 성공 확률 이것이 베타 분포의 분자와 얼마나 유사한 지 알 수 있습니다. 사실, 이항 분포의 이전을 찾으면 베타 분포가됩니다. 베타의 도메인이 0 대 1이기 때문에 놀라운 일이 아니며, 이것이 베이 즈 정리에서 수행하는 작업입니다. 매개 변수 통합하십시오 .이 경우 성공 가능성은 다음과 같습니다. 여기에서 -주어진 성공 확률의 확률 (밀도) 베타 배포판의 이전 설정 및S S F ( X | X ) = F ' ( X는 | s의 ) F ( S )x,yssf(s)f'(X|s)s

f^(x|X)=f(X|s)f(s)01f(X|s)f(s)ds,
f(s)f(X|s)-확률 주어진이 데이터 세트의 밀도 (즉, 성공과 실패가 관찰 됨) .s

1
@ Xi'an OP는 역사에 관심이없는 것 같습니다.
Aksakal

1
"이 공식의 기원에 대한 설명은 원래 개발 된 상황에 관계없이"역사처럼 들린다. :-).
whuber

3
나는 역사와 첫 원칙에 동시에 관심을 가질 수 있다고 생각합니다. :-) 답은 수학적으로 정확하지만 불행히도 너무 일반적입니다. 유한 정수로 음이 아닌 함수의 밀도를 만들 수 있습니다. 그러면이 특정 배포판 계열에서 무엇이 특별합니까? 따라서 귀하의 접근 방식이 두 가지 관점을 모두 만족시키지 못하는 것 같습니다.
whuber

2
@WillBradshaw, 그렇습니다. 일반적으로 확률과 시행 횟수를 매개 변수로하여 이항 분포를 실패 횟수 (또는 성공)의 함수로 간주합니다. 이 방법은 불연속 분포 입니다. 그러나 성공 및 실패 수를 매개 변수로 지정하여 확률의 함수로 보았을 때 재조정하면 베타 분포, 연속 분포, btw가됩니다.
Aksakal

2
베타 분포에 대한 Wikipedia 기사 칼 피어슨에 흔적 그것은 정확히 같은 시안 @ 의해 제안했다. Stigler는 자신 의 통계 이력 : 1900 년 이전의 불확실성 측정에서 현대 표기법을 사용한 Pearson의 도출에 대해 간단히 설명합니다.
whuber

15

여기에 이미지 설명을 입력하십시오

(1763) 토마스 베이 즈는 매우 같이이 이름을 사용하지 않고] 베타 분포를 유도 사후 분포의 첫 번째 예 낳은, 레온하르트 오일러 (1766) 베타 통합 작업을 지적 Glen_b 몇 년으로하지만, 적분도 나타납니다 오일러 (1729 또는 1738) [오페라 옴니, I14, 1 {24] 팩토리얼 함수를 일반화하는 방법으로서 정규화 베타 상수의 이유 일 수있다 라고도 오일러 기능 . 데이비스B ( a , b ) B(a,b)월리스 (1616-1703), 뉴턴 (1642-1726) 및 스털링 (1692-1770)은 이전의 적분의 특수 사례를 다룬다. Karl Pearson (1895)은 먼저이 분포 군을 Pearson Type I 로 분류했습니다 .


역사적으로 그 순서대로 나타나지는 않았지만 베타 분포에 대한 직관적 인 진입은 Fisher의 분포를 통해 이루어 이는 비율의 분포에 해당합니다. 여기서 분산 추정기의 일반적인 표기법을 의도적으로 사용했습니다. 두 분산의 동등성을 테스트하기 위해 나타 났으며 동기가 부여되었습니다. 그런 다음 반면 반대로 이면 의 밀도 찾기ρ = σ 2 1 / σ (2) (2)F(p,q)

ϱ=σ^12/σ^22pσ^12χp2qσ^12χq2
pϱq+pϱB(p/2,q/2)
ωB(a,b)
ω/a(1ω)/bF(2a,2b)
B(a,b)따라서 분포는 가변 단계의 변화입니다. 분포 의 밀도 , 및 변수 로 변환되는 Jacobian은 는 변환 밀도 [여기서 모든 정규화 상수는 밀도가 하나에 통합되도록함으로써 얻어진다.F(p,q)
fp,q(x){px/q}p/21(1+px/q)(p+q)/2
y={px/q}{1+px/q}y(0,1)
x=qyp(1y)
dxdy=qp(1y)+qyp(1y)2=pq(1y)2
g(y)yp/21(1y)q/2+1(1y)2=yp/21(1y)q/2+1

2
+1. K. Pearson은 단순히 베타 분포를 "카탈로그"한 것이 아니라 , 이항식의 미분 방정식과 정규 분포의 미분 방정식 사이에서 관찰 된 관계에서 영감을 얻은 미분 방정식의 해를 통해 도출 했습니다. 이항 차 방정식을 초기 하 분포로 일반화하면 솔루션에 "Type I"및 "Type II"베타 분포가 포함 된 미분 방정식의 일반화가 생성되었습니다. 이것은 OP가 추구하는 것으로 보이는 일종의 ab initio 파생물입니다.
whuber

2
이 답변을 공부하면 많은 것을 배울 수 있다고 생각합니다. 현재로서는 나에게 너무 발전했지만 시간이 있으면 다시 돌아와서 언급 한 주제를 연구 한 다음 다시 이해하려고 노력할 것입니다. 많은 감사합니다. :)
Will Bradshaw 1

1

우선, 나는 머리 속에 개념을 수학적으로 정확하게 설명하는 것은 좋지 않지만 간단한 예를 사용하여 최선을 다할 것입니다.

활, 많은 화살, 목표물이 있다고 상상해보십시오. 또한 적중률 (목표를 타격하기위한)는 정확히 목표 중심까지의 거리와 여기서 x는 중심까지의 거리입니다. 대상의 ( ). 들면 이 가우시안의 1 차 근사하다. 그것은 당신이 가장 자주 황소 눈을 쳤다는 것을 의미합니다. 유사하게, 그것은 예를 들어 브라운 입자의 확산으로 인한 종 모양의 곡선과 비슷합니다.λ

λ=g(x)=λmax(q|xx0|)1q, q>0, 0λλmax
x0q=1/2

이제 누군가가 정말 용감하고 어리석은 사람이 당신을 속이고 모든 장면에서 목표를 대체한다고 가정합니다. 따라서 우리는 자체를 임의의 변수로 만듭니다. 그 사람의 움직임의 분포가 의 (p-1)-힘 (즉, )으로 설명 될 수 있다면 임의의 변수 변환 ( )은 베타 분산 유발합니다 .x0g(x)P(x0)=Cg(x)p1)P(λ)dλ=P(x0)dx0λ

P(λ)=P(g1(λ))|dg1(λ)dλ|=Cλp1(λmaxλ)q1

정규화 상수 는 베타 함수입니다. 베타 배포판의 표준 매개 변수화를 위해 합니다.Cλmax=1

다시 말해 베타 분포는 지터 분포의 중심에있는 확률의 분포로 볼 수 있습니다.

이 유도가 귀하의 강사가 의미하는 바에 다소 가깝기를 바랍니다. 및 의 기능적 형태 는 매우 유연하며 삼각형과 같은 분포 및 U 자형 분포 (아래 예 참조)에서 급격한 정점 분포에 도달합니다.g(x)P(x0)

참고 : 나는 이것을 박사 과정에서 부작용으로 발견했으며, 고정되지 않은 신경 튜닝 곡선의 맥락에서 스파이크 수 분포가 0으로 증가하는 모드 (제로 모드의 바이 모달)와 관련하여 논문에서 그것에 대해보고했습니다. 상술 한 개념을 적용하면 신경 운동성을위한 베타-포아송 혼합물 분포가 산출되었다. 이 분포는 데이터에 적합 할 수 있습니다. 적합 된 파라미터 는 역 논리를 적용하여 분포 와 지터 분포 를 모두 추정 할 수 있습니다. Beta-Poisson 혼합물은과 분산을 모델링하기 위해 널리 사용되는 음성 이항 분포 (Gamma-Poisson 혼합물)에 대한 매우 흥미롭고 유연한 대안입니다. 아래는 "Jitter "의 예입니다.g(x)p(x0) 베타 "-실제 아이디어 :

Beta-Poisson 스파이 킹 모델로 이어지는 지터 모델.

A : 삽입 된 지터 분포 ( ) 에서 도출 된 시뮬레이션 된 1D 시행 변위 . 시험 평균 소 성장 (검은 색 선)은 지터가없는 기본 튜닝 곡선 (파란색 선, 사용 된 매개 변수 : 비해 넓고 피크 속도가 낮습니다. . B :의 생성 분포 에서 . N = 100 개 실험 전반 및 베타 분포의 해석 PDF C : 매개 변수 포아송 과정에서 시뮬레이션 스파이크 횟수 분포 내가 시험의 인덱스를 나타낸다 및 상기 스케치 된 바와 같이 도출 된 결과의 베타-포아송 분포.P(jitter)g(x)p1λmax=10,p=.6,q=.5λ X 0 λ Iλx0λiD : 임의의 시프트 각도를 갖는 2D의 유사한 상황이 동일한 통계를 초래합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.