간단한 선형 회귀 모델
yi=α+βxi+ε
그 뒤에 확률 모델의 관점에서 쓸 수 있습니다
μi=α+βxiyi∼N(μi,σ)
즉, 종속 변수 는 평균 의해 매개 변수화 된 정규 분포 , 즉 및 표준 편차 의해 매개 변수화 된 의 선형 함수를 . 정규 최소 제곱을 사용하여 이러한 모형을 추정 하는 경우 적합치의 제곱 오차를 예측 된 값으로 최소화하여 최적의 매개 변수 값을 검색하므로 확률 적 공식에 신경 쓸 필요가 없습니다 . 한편, 최대 우도 추정을 사용하여 이러한 모형을 추정 할 수 있습니다. 여기서 우도 함수를 최대화하여 최적의 모수 값을 찾고자합니다.μ i X α , β σ α , βYμiXα,βσα,β
argmaxα,β,σ∏i=1nN(yi;α+βxi,σ)
여기서 은 지점 에서 평가 된 정규 분포의 밀도 함수이며 및 표준 편차 매개 변수화됩니다 .y i α + β x i σNyiα+βxiσ
우도 함수 만 최대화하는 대신 베이지안 접근법 에서 매개 변수에 대한 사전 분포를 가정 하고 베이 즈 정리를 사용합니다.
posterior∝likelihood×prior
우도 함수는 위와 동일하지만 변경된 것은 추정 된 모수 대한 일부 사전 분포를 가정 하여 방정식에 포함한다는 것입니다.α,β,σ
f(α,β,σ∣Y,X)posterior∝∏i=1nN(yi∣α+βxi,σ)likelihoodfα(α)fβ(β)fσ(σ)priors
"어떤 배포판?" 선택의 수가 무제한이기 때문에 다른 질문입니다. 를 들어 예를 들어, 당신은 할 수 매개 변수가 정상 일부에 의해 매개 변수화 분포 가정 하이퍼 파라미터 , 또는 - 분포를 당신은 많은 가정을하지 않으려면 무거운 꼬리, 또는 균일 한 분포를 가정 할 경우,하지만 당신은 가정 할 매개 변수가 될 수 있음을 사전 에 대한 등 "지정된 범위에서 아무것도", 당신은 몇 가지 가정이 필요 이전에 표준 편차가 긍정적 인 할 필요가 있기 때문에, 제로보다 큰 것으로 묶여 분포를. 이는 John K. Kruschke에 의해 아래에 예시 된 바와 같이 모델 공식화로 이어질 수 있습니다.α,βtσ
(출처 : http://www.indiana.edu/~kruschke/BMLR/ )
최대 우도에서 각 모수에 대해 최적의 단일 값을 찾고 있었지만 베이 즈 정리를 적용하여 베이지안 접근에서는 모수의 사후 분포 를 얻습니다 . 최종 평가는 데이터에서와에서 제공하는 정보에 따라 달라집니다 전과 하지만, 더 많은 정보가 데이터에 포함되어, 덜 영향력은 전과는 .
균일 한 우선 때 정규화 상수를 삭제 한 후 형식을 취합니다 . 따라서 베이 즈 정리는 우도 함수에만 비례하므로 사후 분포는 최대 우도 추정치와 정확히 같은 시점에 최대 분포에 도달합니다. 다음에, 제곱 오차를 최소화하는 것이 정규 우도를 최대화하는 것에 대응하기 때문에, 균일 한 사전 하에서의 추정치는 일반적인 최소 제곱을 사용하는 것과 동일 할 것이다 .f(θ)∝1
경우에 따라 베이지안 접근법에서 모형을 추정하기 위해 켤레 사전을 사용할 수 있으므로 사후 분포를 직접 사용할 수 있습니다 ( 여기의 예 참조 ). 그러나 대부분의 경우 사후 분포를 직접 사용할 수 없으므로 모형을 추정 하기 위해 Markov Chain Monte Carlo 방법 을 사용해야 합니다 ( 선형 회귀 매개 변수를 추정하려면 Metropolis-Hastings 알고리즘을 사용하는 이 예 를 확인하십시오 ). 당신이 매개 변수의 점 추정치에만 관심이 있다면 마지막으로, 당신이 사용할 수있는 최대 사후 확률을 , 즉,
argmaxα,β,σf(α,β,σ∣Y,X)
로지스틱 회귀 분석에 대한 자세한 설명은 베이지안 로짓 모형을 확인하십시오 . 실.
자세한 내용은 다음 책을 확인하십시오.
Kruschke, J. (2014). 베이지안 데이터 분석 수행 : R, JAGS 및 Stan이 포함 된 자습서. 학술 출판사.
Gelman, A., Carlin, JB, Stern, HS 및 Rubin, DB (2004).
베이지안 데이터 분석. 채프먼 & 홀 / CRC.