로지스틱 회귀는 선형 조합으로 설명 할 수 있습니다.
η=β0+β1X1+...+βkXk
링크 함수 통해 전달됩니다 .g
g(E(Y))=η
여기서 링크 함수는 로짓 함수입니다.
E(Y|X,β)=p=logit−1(η)
여기서 는 값만 취하고 역 로짓 함수는 선형 조합 를이 범위로 변환 합니다. 이것은 고전적인 로지스틱 회귀가 끝나는 곳입니다.{ 0 , 1 } ηY{0,1}η
당신은 리콜 그러나 경우 에서만 값을 변수 ,보다 로 간주 할 수 . 이 경우 로짓 함수 출력은 "성공"의 조건부 확률, 즉 로 간주 될 수 있습니다 . Bernoulli 분포 는 일부 매개 변수 를 사용하여 이진 결과를 관찰 할 확률을 나타내는 분포 이므로 과 같이 설명 할 수 있습니다.E(Y)=P(Y=1){0,1}E(Y|X,β)P(Y=1|X,β)P(Y=1|X,β)pY
yi∼Bernoulli(p)
로지스틱 회귀 분석을 통해 독립 변수 가진 togeder가 선형 조합 형성하는 일부 매개 변수 를 찾습니다 . 고전적 회귀에서는 (링크 함수를 항등 함수로 가정) 에서 값을 취하는 모델 대해 를 적합하도록 변환해야합니다. 의 의 범위.X η E ( Y | X , β ) = η Y { 0 , 1 } η [ 0 , 1 ]βXηE(Y|X,β)=ηY{0,1}η[0,1]
이제 베이지 안에서 로지스틱 회귀를 추정하려면 선형 회귀와 마찬가지로 매개 변수에 대한 몇 가지 선행 사항을 선택한 다음 ( Kruschke et al, 2012 참조 ) logit 함수를 사용하여 선형 조합 를 변환하여 출력을 변수 를 설명하는 Bernoulli 분포의 모수 . 예, 실제로 방정식과 로짓 연결 함수를 자주 사용하는 경우와 같은 방식으로 사용하고 나머지는 (예 : 선회 회귀 추정 베이지안 방식과 같은) 사전 작업을 선택합니다. η p YβiηpY
사전을 선택하는 간단한 방법 은 사전 설정되거나 취해진 매개 변수 및 와 함께 대해 정규 분포를 선택하는 것입니다 (그러나 보다 강력한 모형의 경우 또는 Laplace 분포 와 같은 다른 분포를 사용할 수도 있음 ). 에서 계층 전과 . 이제 모델 정의를 사용하면 JAGS 와 같은 소프트웨어를 사용 하여 Markov Chain Monte Carlo 시뮬레이션 을 수행 하여 모델을 추정 할 수 있습니다. 아래에는 간단한 물류 모델에 대한 JAGS 코드가 게시되어 있습니다 ( 자세한 예제는 여기 참조).β i μ i σ 2 itβiμiσ2i
model {
# setting up priors
a ~ dnorm(0, .0001)
b ~ dnorm(0, .0001)
for (i in 1:N) {
# passing the linear combination through logit function
logit(p[i]) <- a + b * x[i]
# likelihood function
y[i] ~ dbern(p[i])
}
}
보시다시피 코드는 모델 정의로 직접 변환됩니다. 어떤 소프트웨어가 수행하는 것이 보통 전과에서 일부 값을 그립니다 a하고 b, 다음은 추정이 값을 사용하여 p마지막으로, 데이터는 이러한 매개 변수를 주어진 가능성을 평가하는 우도 함수를 사용하여 (이것은 당신이 베이 즈 정리를 사용할 때 볼 수 있습니다 여기 에 더 자세한 설명).
기본 로지스틱 회귀 모델은 계층 모델 ( hyperpriors 포함 )을 사용하여 예측 변수 간의 종속성을 모델링하도록 확장 될 수 있습니다 . 이 경우 독립 변수 사이의 공분산 에 대한 정보를 포함시킬 수있는 다변량 정규 분포 에서 그릴 수 있습니다βiΣ
⎛⎝⎜⎜⎜⎜β0β1⋮βk⎞⎠⎟⎟⎟⎟∼MVN⎛⎝⎜⎜⎜⎜⎜⎡⎣⎢⎢⎢⎢μ0μ1⋮μk⎤⎦⎥⎥⎥⎥,⎡⎣⎢⎢⎢⎢⎢σ20σ1,0⋮σk,0σ0,1σ21⋮σk,1……⋱…σ0,kσ1,k⋮σ2k⎤⎦⎥⎥⎥⎥⎥⎞⎠⎟⎟⎟⎟⎟
...하지만 자세한 내용은 여기로 넘어가겠습니다.
여기에있는 "베이지 아"부분은 베이 즈 정리를 사용하고 확률론적인 용어로 모형을 정의하는 것입니다. "베이지안 모델"의 정의는 여기를 참조 하고 베이지안 접근에 대한 일반적인 직관 은 여기를 참조하십시오 . 또한이 방법을 사용하면 모델을 정의하는 것이 매우 간단하고 유연합니다.
Kruschke, JK, Aguinis, H. & Joo, H. (2012). 조직 과학의 데이터 분석을위한 베이지안 방법. 조직 연구 방법, 15 (4), 722-752.
Gelman, A., Jakulin, A., Pittau, GM 및 Su, Y.-S. (2008). 로지스틱 및 기타 회귀 모델에 대한 약한 유익한 기본 사전 배포입니다. 응용 통계의 연대기, 2 (4), 1360–1383.