계산에 확률 밀도 함수 사용. 다시 말해, 그러한 방정식을 평가하는 방법입니다.
나는 당신이 여전히 빈번한 관점에서 이것을 생각하고 있다고 생각합니다 : 당신이 점 추정치를 찾고 있다면, 후자는 당신에게 그것을주지 않을 것입니다. PDF를 넣고 PDF를 꺼냅니다. 사후 분포에서 통계를 계산하여 점 추정치를 도출 할 수 있지만 조금만 살펴 보겠습니다.
나는 사전 대 사후 개념을 얻고 수동으로 테이블을 사용하여 적용하는 방법을 이해합니다. pi는 추정 된 인구 비율 또는 확률을 나타냅니다.
p ( x ) ππ(x) 는 와 동일 합니다. 둘 다 PDF입니다. 는 일반적으로 특정 PDF가 사전 밀도임을 나타내는 데 사용됩니다.p(x)π
나는 당신이 생각하는 것만 큼 사전과 후부를 얻지 못한다고 생각합니다. 따라서 베이지안 통계의 기본 토대 인 주관적 확률로 다시 돌아가 봅시다 .
주관적 확률에 대한 사고 실험
동전을 선물하고이 동전이 공정한 동전이라고 생각하는지 묻습니다. 많은 사람들이 확률 클래스에서 불공평 한 동전에 대해 이야기하는 것을 들었습니다. 그러나 실제로는 실제 동전을 본 적이 없으므로 "그렇습니다. 물론 그것이 공정한 동전이라고 생각합니다." 그러나 내가 당신 에게이 질문을하고 있다는 사실은 당신을 조금 벗어납니다. 따라서 당신의 추정이 공평하다고 생각하지만, 그렇지 않다면 실제로 놀라지 않을 것입니다. 당신이 주머니에서이 동전을 발견했을 때보 다 훨씬 덜 놀랍습니다. (그것이 모두 진짜 통화라고 가정하고, 내가 의심하는 행동 때문에 지금 당장 나를 믿지 않기 때문입니다).
이제 몇 가지 실험을 진행합니다. 100 번 넘기면 동전이 53 두를 돌려줍니다. 당신은 그것이 공정한 동전이라는 것을 훨씬 더 확신하지만, 그렇지 않을 가능성에 여전히 열려 있습니다. 차이점은 이제이 동전이 일종의 편견이있는 것으로 판명되면 놀랄 것입니다.
우리는 어떻게 동전이 머리를 보여 확률에 대해 구체적으로, 여기에 귀하의 사전 및 사후 신념을 표현할 수있다 (이 우리 것 나타낸다 )? 빈번한 환경에서, 당신의 이전의 믿음, 즉 귀무 가설은 입니다. 실험을 실행 한 후에는 null을 거부 할 수 없으므로 동전이 공평하다고 가정합니다. 그러나 우리 는 동전이 공정하다는 자신감 의 변화를 어떻게 캡슐화 합니까? 실험 후 당신은 동전이 공정하다고 내기 할 위치에 있지만, 실험 전에는 어리 석었을 것입니다.θ = 0.5θθ=0.5
베이지안 설정에서는 확률을 스칼라 값으로 처리하지 않고 임의의 변수 (예 : 함수)로 처리하여 제안에 대한 신뢰를 캡슐화합니다. 대신 라고 말하면 PDF의 분산에 대한 신뢰를 캡슐화 할 수 있습니다. 높은 분산을 설정하면 "확률이 0.5라고 생각하지만 실제로 세계에서 관찰 할 확률이이 값에서 멀리 떨어져 있어도 놀라지 않을 것입니다. 라고 생각합니다. 하지만 솔직히 확실하지 않습니다. " 낮은 분산을 설정함으로써 우리는 "확률이 0.5라고 생각할뿐 아니라 실험이 매우 근접하지 않은 값을 제공한다면 매우 놀랄 것입니다.θ ∼ N ( 0.5 , σ 2 ) θ = 0.5 θ = 0.5 θ = 0.5θ=0.5θ∼N(0.5,σ2)θ=0.5θ=0.5. "따라서이 예에서는 실험을 시작할 때 차이가 큰 사전이 있습니다. 이전을 뒷받침하는 데이터를받은 후 이전의 평균은 동일하게 유지되었지만 차이가 훨씬 좁아졌습니다. 실험을 실행 한 후 이전보다 가 훨씬 높습니다.θ=0.5
계산은 어떻게합니까?
우리는 PDF로 시작하여 PDF로 끝납니다. 점 추정치를보고해야 할 때, 사후 분포의 평균, 중간 또는 모드와 같은 통계를 계산할 수 있습니다 (손실 기능에 따라 달라집니다. 지금은 다루지 않겠습니다. 평균을 고수합시다). PDF에 대해 닫힌 양식 솔루션이있는 경우 이러한 값을 결정하는 것이 쉽지 않을 수 있습니다. 후부가 복잡하면 MCMC와 같은 절차를 사용하여 후부에서 샘플링하고 추출한 샘플에서 통계를 도출 할 수 있습니다.
베타 이전과 이항 가능성이있는 예에서 사후 계산은 매우 깨끗한 계산으로 줄어 듭니다. 주어진:
- 이전 :θ∼Beta(α,β)
- 가능성 :X|θ∼Binomial(θ)
그런 다음 후부는 다음과 같이 감소합니다.
- 후부 :θ|X∼Beta(α+∑ni=1xi,β+n−∑ni=1xi)
이는 베타 베타 및 이항 가능성이있을 때마다 발생하며, 이유는 DJE가 제공 한 계산에서 분명해야합니다 . 특정 사전 우도 모델이 항상 이전과 같은 종류의 분포를 갖는 사후를 제공하는 경우, 이전과 가능성에 사용 된 분포 유형 간의 관계를 Conjugate 라고 합니다. 켤레 관계 가있는 여러 분포 쌍이 있으며 , 베이지안에서는 활용을 매우 자주 활용하여 계산을 단순화합니다. 특정 가능성이 주어지면 사전에 켤레를 선택하여 인생을 훨씬 쉽게 만들 수 있습니다 (존재하는 경우 이전 선택을 정당화 할 수 있음).
베타 (1,1)은 평균이 1이고 stdev가 1 인 PDF를 참조한다고 생각합니까?
정규 분포의 공통 모수화에서 두 매개 변수는 분포의 평균 및 표준 편차를 나타냅니다. 그러나 그것은 우리가 정규 분포를 모수하는 방법입니다. 다른 확률 분포는 매우 다르게 매개 변수화됩니다.
베타 분포는 일반적으로 로 매개 변수화되며 여기서 및 는 "모양"매개 변수라고합니다. 베타 배포판은 매우 유연하며 이러한 매개 변수 설정 방법에 따라 다양한 형태를 취 합니다. 이 매개 변수화가 원래의 가정과 어떻게 다른지 설명하기 위해 베타 랜덤 변수의 평균 및 분산을 계산하는 방법은 다음과 같습니다.Beta(α,β)αβ
XE[X]var[X]∼Beta(α,β)=αα+β=αβ(α+β)2(α+β+1)
보다시피 알 수 있듯이 평균과 분산은이 분포의 모수화의 일부가 아니지만 입력 모수의 간단한 기능인 폐쇄 형 솔루션을 가지고 있습니다.
잘 알려진 다른 분포의 모수화의 차이점을 자세히 설명하지는 않지만 몇 가지를 찾아 보는 것이 좋습니다. 모든 기본 텍스트, 심지어 Wikipedia도 매개 변수를 변경하면 분포를 수정하는 방법을 설명해야합니다. 다른 배포판 간의 관계에 대해서도 읽어야합니다 (예 : 은 과 동일 ).Beta(1,1)Uniform(0,1)